您的位置 首页 > 科技

怎么用语音识别技术 怎么使用语音识别?

怎么用语音识别技术

怎么用语音识别技术 怎么使用语音识别?

语音识别技术如何入门?

怎么使用语音识别?

这个一般要到大学开始才能接触,基础的要学《数字电路技术》、《数字信号处理》、《语音数字信号处理》、《matlab编程》或《C语言编程》等课程,然后从基础算法到多种算法处理,一步步进阶,这也基本上开始进入研究生的方向课程学习了。

语音识别技术如何入门?

语音识别一般包括三个相互独立有相互依存的环节,分别是语音—>文本,文本—>文本,文本—>语音,或文本—>命令。作为语音识别的入门级概念,下面就简单做以说明。

一、语音到文本

这是语音识别的关键和基础。在这个环节,识别算法抓取语音中的特征信息(经过大数据分析),把语音(声音信息)“翻译”成对应的文本信息。前者属于声音文件,后者属于文本文件。这一步只是做了“翻译”,也可以理解为对声音的“识别”—语音识别。

二、文本到文本

把由第一步获得的文本信息,通过“查字典”的方式,查找对应的文本信息(当然需要足够庞大的文本释义数据库,和检索的足够高效率)。如语音解释得到的文本“听歌曲”就会查找得到很多和“歌曲”相关的词条:歌手名字检索,流行歌曲检索,英文歌曲检索。。。这个环节也可以成为“语义解析”。

三、文本还原到语音或命令执行

把上个步骤查到的文本信息,通过“语音合成”算法,还原成自然人声,就可以起到类似人和人交流的感觉。最典型的应用就是“在线翻译”,和/或语音导航。

语音控制是目前智能家居/智能硬件最“时髦”的技术,就是在这个环节,把得到的“命令信息”通过执行机构,让硬件产品(如机器人)做出相应的动作。或智能家居中的各种控制指令等等。

四、在线和离线/或云端和本地语音识别的区别和联系

以上所讲的重点立足于“实时语音识别”,就是说,用户随意讲一句话,都可以得到一个结果(语音反馈,文本反馈,画面反馈,机器人动作等等)。可想而知,在整个过程中,需要机器/设备经过一些列的数据传输(连接到云端)和运算(云计算)。可以看出,真正意义上的有现实意义的语音识别控制系统(如智能家居,人工智能机器人等)是一个非常复杂的“系统工程”。这就是在线语音识别或称云端语音识别的特点和优势;

向对应的,比如我们执行一个简单的电灯的开关,如果也搞这么复杂的系统,连接到云端,显然从成本考虑的角度,任何人心理上都不太能接受。这个时候,“物美价廉”的本地化,离线式、单芯片方案就显得那么的招人喜爱。

事实上,一般一个单芯片的控制方案(本地语音识别控制)成本也就十几元,非常适合智能家庭中智能单品控制。

语音控制灯

语音控制看电视

总结

语音控制是人工智能(AI)核心技术,实现语音交互,人机对话,语音控制等等一些列智能应用。“解放人手”,惬意人生。

相关文章