<div dir="ltr"><div class="gmail_extra"><div class="gmail_signature"><div style="text-align:right"><br><div style="text-align:auto"><font class="Apple-style-span" color="#660000" face="georgia, serif"><p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07"> i originally just wanted to say, it brings all the info with, doesn't need lookups, but realized i couldn't say that without explaining that this is my intuitive <i>impression.</i></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">you see, i thought google's voice recognition software (hereafter anthropomorphically called 'google') went the long way 'round, as it were, listening, parsing, and responding attentively to everyone individually -- at least, during the all-too-brief few months that "1-800-ask-google" (or was it 411 google?) existed.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">it must be noted that, for me personally, experiences with this specific service populated almost the entirety of the Venn diagram intersection of google, phone-voice-recognition, and corporate-machine learning (either theoretically or practically).  add in the couple times i tried to use google voice to take a memo, and then, well, there you have it.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">it also must be noted that, historically, although able now and again to intuit grammar & syntax of a newly encountered system, i have also -- true  fact -- so flustered a phone-tree-bot (a t & t,  female variety) -- and i mean *flustered* -- that it said, in a much louder, clipped, and forceful voice: "...If you want to INTERRUPT me, PLEASE SAY 'STOP.'"</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">nonetheless, these are some of the hypothesis which I, knowing nothing, formulated over time, as i used the service. </p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<ul>
<li style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">that whatever library it loads it has already to hand (it only needed to 'look up' actual addresses and #s,</li>
<li style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">that it takes it a moment to understand relationship</li>
<li style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">that new implications of relationship between phonemes are stored forever as precedent</li>
<li style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">that it learns very very fast</li>
<li style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">that it applies what it has learned globally, as in, not person-specific</li>
</ul>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">i noticed how quickly it trained itself to not only the sound of my voice, but to my verbal style, word order and choice of words.  i tested it by having friends refer to places or ask for answers in ways specific to me, from different phones.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">i decided i didn't want to speak at all one day, and answered google's questions by pressing keys - 1 for yes, 2 for no, or pressing the number that corresponded to my choice in a list.  by the second question it had completely figured out what i was doing -- on the first it stumbled over the multiple choice, only natively 'understanding' the new format for yes/no.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">and get this: less than a week later it was offering that format among the response options it listed for users.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">all of which may  not have helped at all, i realize.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">and perhaps neither will this page, which i thought was pretty interesting, if over my head.</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07">ah well, have fun!</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Georgia;color:#5c0b07;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">On Sun, Apr 12, 2015 at 12:19 AM, Adam Munich <<a href="mailto:adam@aperture.systems"><span style="color:#1d59c7">adam@aperture.systems</span></a>> wrote:</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">I'm trying to reverse engineer the "OK google" functionality implemented in my phone. </p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:12.0px Helvetica"><img src="webkit-fake-url://DC6B5434-B047-445E-90CF-26D324A78869/0.png" alt="0.png"></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">What do you suppose I do with those feature / data sets? Since "OK google" responds to my voice independently of the rate of speech, methinks they are using a combination of regression analysis and discrete time warping. </p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">But, it's seemingly both speaker and pitch independent too, so there must be something else going on. There's no way they implemented a full Hidden Markov Model inside the phone's DSP, (it wouldn't make sense for just one hotword).</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">Thoughts?</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">---</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">Aperture Systems: Redefining Radiography -  <a href="http://aperture.systems/"><span style="color:#1d59c7">http://aperture.systems/</span></a></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#1d59c7"><a href="http://adammunich.com/">http://adammunich.com/</a><span style="color:#222222"> - Cell: <a href="tel:%2B1-650-452-0554"><span style="color:#1d59c7">+1-650-452-0554</span></a></span></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">Be • knowledgeable •  social • patient • fearless • compassionate • fun • humble • forgiving. </p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">Be a leader</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">_______________________________________________</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">sudo-discuss mailing list</p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#1d59c7"><a href="mailto:sudo-discuss@lists.sudoroom.org">sudo-discuss@lists.sudoroom.org</a></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#1d59c7"><a href="https://lists.sudoroom.org/listinfo/sudo-discuss">https://lists.sudoroom.org/listinfo/sudo-discuss</a></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222;min-height:15.0px"><br></p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;font:13.0px Arial;color:#222222">-- </p>
<p style="margin:0.0px 0.0px 0.0px 0.0px;text-align:right;font:10.0px Georgia;color:#2e0503"><b><i>Be seeing you.</i></b></p></font></div></div></div>
</div></div>