<div dir="ltr"><div class="gmail_quote"><div dir="ltr"><div class="gmail_quote">I'm trying to reverse engineer the "OK google" functionality implemented in my phone. <div dir="ltr"><div><br></div><div><img src="cid:ii_i8dpk8220_14cab02784e1dcd9" width="544" height="353"><br>​<br></div><div>What do you suppose I do with those feature / data sets? Since "OK google" responds to my voice independently of the rate of speech, methinks they are using a combination of regression analysis and discrete time warping. </div><div><br></div><div>But, it's seemingly both speaker and pitch independent too, so there must be something else going on. There's no way they implemented a full Hidden Markov Model inside the phone's DSP, (it wouldn't make sense for just one hotword).</div><div><br></div><div>Thoughts?</div><div><br></div><div><br></div><br clear="all"><div><div>---<br>Aperture Systems: Redefining Radiography -  <a href="http://aperture.systems/" target="_blank">http://aperture.systems/</a><br><a href="http://adammunich.com/" target="_blank">http://adammunich.com/</a> - Cell: <a href="tel:%2B1-650-452-0554" value="+16504520554" target="_blank">+1-650-452-0554</a><br><br>Be • knowledgeable •  social • patient • fearless • compassionate • fun • humble • forgiving. <br><br>Be a leader</div></div>
</div>
</div><br></div>
</div><br></div>