新闻资讯
NEWS
联系我们
CONTACT US
语音接口技巧浅析
发布时间:2017-09-08 人气:0次 编辑:未知
style="width: 500px; height: 302px;" />语音接口已经成为一个改变人机交互方法的全新切入点。这些体系若何工作?打造如许一款设备在硬件方面有什么请求?跟着语音控制接口变得越来越普及,德州仪器(TI)的一位工程师对此技巧进行了深刻的懂得,并分享了其对这项技巧的熟悉和看法。 语音接口是什么? 语音辨认技巧自20世纪50年代起开端涌如今我们身边。那时贝尔实验室的工程师创建了一款可以辨认单个数字的体系。然而,语音辨认只是完全语音接口技巧的一部分。语音接口包含传统用户接口的所有方面:它能出现信息并为用户供给一种操控方法。在语音接口中,操控、甚至一皓信息的出现都精晓过语音实现。在一些如按钮或显示屏等传统的用户接口上,也可能设备语音接口这一选项。 大年夜部分人碰到的第一款语音接口设备很有可能是移动德律风,或者是小我电脑上异常基本的将说话转换成文字的法度榜样。然而,这些设备的运行都异常迟缓、辨认不精确且可识其余词汇有限。 那是什么将语音辨认大年夜一种从属性功能变成了计算机世界炙手可热的技巧呢?起首,如今的计算才能和算法机能都有明显的进步(如不雅你对隐马尔科夫模型有所懂得,对此你会有更直不雅的熟悉)。其次,云技巧和大年夜数据分析的应用也改进了语音辨认效不雅,并且进步了识其余速度和精确性。 为你的设备添加语音辨认功能 一些人经常会对若何为项目添加某种语音接口存在疑问。实际上, TI 供给几种不合的语音接口产品,包含 ARM® 处理器的Sitara™系列产品和 C5000™ DSP系列产品,这些产品都具备语音处理的才能」现系列的产瓢旆ㄐ千秋,分别实用于不合的应用。 在选择 DSP 和 ARM 这两种解决筹划时,推敲的关键身分在于这款设备可否或将若何应用云语音平台。傍边有三种应用处景:第一种是离线,所有的处理过程都在本地设备上产生。第二种是在线,经由过程基于云端的语音处理设备,如亚马逊的 Alexa,谷歌助手或 IBM Watson;第三种是两者混淆。 离线:车袈湄语音控制 大年夜今朝的成长趋势来看,人们似乎欲望所有事物都可以或许连接至互联网。然而,无论是出于成本推敲或是缺乏靠得住的收集连接,在某些应用中,连接收集的意义其实不大年夜。在现代的汽车应用中,很多娱乐信息体系就采取潦攀离线语音接口体系。这些语音接口体系平日只能应用有限的敕令集,如“拨打德律风”、“播放音乐”和“进步或降低音量”。固然传统处理器的语音辨认算法取得了重大年夜进展,但如有不尽如人意之处。碰到如许的情况,例如 C55xx 等 DSP 可可以或许为体系供给最佳的机能。 在线:智能家庭中枢 关于语音接口的很多热议重要环绕于例如 Google Home 和亚马逊 Alexa 等互联设备。因为亚马逊许可第三方进入其已配备 Alex 语音办事的语音处理生态体系,他们在这方面的成长备受注目。别的,如 Microsoft Azur 等其它的云办事也可以供给语音辨认办事和类似功能。值得留意的是,这些设备的声音处理过程全部产生在云端。 是否值得为了这种便捷的集成而向语音办事供给商供给上行数据完全取决于用户。然则,云办事供给商承担了重要的工作,设备商须要做的很简单,实际上,因为接口的语音合成部分也产生在云端, Alexa 只要完成最简单的功能,即播放并记录灌音文件。既然不须要特其余旌旗灯号处理功能, ARM 处理器足以处理接口工作。这意味着,如不雅你的设备已配备 ARM 处理器,你就可能集成云计算语音接口。 事实上,存眷 Alexa 等不克不及供给的办事也是异常重要的。 Alexa 不直接履行任何一种设备控制或云集成。驱动 Alexa 典范多“智能设备”都具备云计算功能,该功能由开辟商供给,可以应用 Alexa 的语音处理才能将驱动输入至现有的云应用。例如,如不雅你告诉 Alexa 须要订一个披萨,你最爱好的披萨店则须要为 Alexa 编制一项“技能”。该项技能是一个可以在你订披萨时定义工作内容的代码。当你每次订披萨时, Alexa 都邑调用该技能。该技能嵌入了可认为你下单的在线订购体系。同样,智能家居设备制造商必须履行 Alexa 若何与本地设备和在线办事互相感化的技能。亚马逊自带很多如许的技能,加上第三方开辟者供给的技能,即便你没有开辟任何技能, Alexa 设备仍然可以异常有效。 混淆:互联主动调温器 有时,即使没有连接互联网,我们也有包管设备的某些基本功能可以正常应用的需求。例如:在连不上彀的时刻,如不雅主动调温器不会自立调节温度,这就会是一个很麻烦的问题。为避免这种问题的产生 ,一个好的产品设计师会设计一些本地的声音处理功能,在功能上实现无缝连接。为了实现此功能,体系必须具有 DSP,例如用于本地语音处理的 C55XX 和用于将已连网的接口连接至云端的 ARM 处理器。 语音触发又是什么?
你也许已经留意到了,直到如今我们还没有说起新一代语音助手真正神奇的处所:那就是始终存眷“触发词汇”。它们将若何追踪你在房间内随便率性地位所发出的声音,或是当设备播放音频瓯,又若何听到你的声音?实现这些其实并没有什么特别神奇的处所,只须要一些智能化软件。这类软件自力于云端的语音接口,也能在体系离线的状况下运行。 这个体系最易懂得的部分就是“唤醒词汇”。唤醒词汇是一个简单的本地语音辨认法度榜样,经由过程持续性采样,在接收的音频旌旗灯号中寻找单个词汇。因为大年夜多半语音办事均愿意接收不含唤醒词汇的音频,是以该词汇不须要指定任何特别的语音平台。因为实现这种功能的请求相对较低,所以经由过程应用 Sphinx 或 KITT.AI 等开源数据库在 ARM 处理器上即可完成操作。 为了听到你在房间内随便率性地位发出的声音,语音辨认设备采取一个叫波束成型的流程。最重要的是,经由过程比较不合声音的达到时光和麦克风间的距朗攀来肯定声音的来源。一旦确认了目标声音的地位,设备就会采取如空间滤波等音频处理技巧来进一步削减噪音并加强旌旗灯号质量。波束成型的实现取决于麦克风的构造。真正实现360度辨认则须要一个非线性麦克风阵列(平日是圆形)。对于壁挂式设备而言,仅需两个麦克风就能启用180度的空间辨别。 语音助手的最后一招是采取主动回波清除(AEC)。 AEC 在某种程度上类似于噪音清除耳机,但应用正好相反。该算法是应用已知的音乐等输出音频旌旗灯号来实现的。在噪音清除耳机应用这点来清除外部杂音, AEC 清除了输出旌旗灯号对输入旌旗灯号在麦克风上的影响。该设备能忽视自身产生的音频,且无论扬声器播放何种内容,其都仍然能接收。实现 AEC 须要大年夜量的计算,个中在 DSP 中效不雅最佳。 为了实施唤醒辨认、波束成型和 AEC 等以上说起的所有功能,则请求 ARM 处理器合营 DSP 合营工作: DSP 加强了所有的旌旗灯号处理功能,而 ARM 处理器控制设备逻辑和接口。 DSP 可在履行输入数据管路方面发挥重要的感化,由此最大年夜限度地削减处理的延迟,大年夜而供给更好的用户体验。 ARM 可以自由运行如 Linux 等高等操作体系以控制其它设备。如许高等的功能全部产生在本地,若应用云办事,将只接收包含最终处理结不雅的单个语音文件。 结论 语音接口似乎已收成了超高的人气,并且将在将来很长一段时光内以不合情势涌如今我们的生活中。尽管有多种不合的处理方法可以实现语音接口办事,但无论你的应用须要何种装配, TI 都可认为你供给幻想的选择。
你也许已经留意到了,直到如今我们还没有说起新一代语音助手真正神奇的处所:那就是始终存眷“触发词汇”。它们将若何追踪你在房间内随便率性地位所发出的声音,或是当设备播放音频瓯,又若何听到你的声音?实现这些其实并没有什么特别神奇的处所,只须要一些智能化软件。这类软件自力于云端的语音接口,也能在体系离线的状况下运行。 这个体系最易懂得的部分就是“唤醒词汇”。唤醒词汇是一个简单的本地语音辨认法度榜样,经由过程持续性采样,在接收的音频旌旗灯号中寻找单个词汇。因为大年夜多半语音办事均愿意接收不含唤醒词汇的音频,是以该词汇不须要指定任何特别的语音平台。因为实现这种功能的请求相对较低,所以经由过程应用 Sphinx 或 KITT.AI 等开源数据库在 ARM 处理器上即可完成操作。 为了听到你在房间内随便率性地位发出的声音,语音辨认设备采取一个叫波束成型的流程。最重要的是,经由过程比较不合声音的达到时光和麦克风间的距朗攀来肯定声音的来源。一旦确认了目标声音的地位,设备就会采取如空间滤波等音频处理技巧来进一步削减噪音并加强旌旗灯号质量。波束成型的实现取决于麦克风的构造。真正实现360度辨认则须要一个非线性麦克风阵列(平日是圆形)。对于壁挂式设备而言,仅需两个麦克风就能启用180度的空间辨别。 语音助手的最后一招是采取主动回波清除(AEC)。 AEC 在某种程度上类似于噪音清除耳机,但应用正好相反。该算法是应用已知的音乐等输出音频旌旗灯号来实现的。在噪音清除耳机应用这点来清除外部杂音, AEC 清除了输出旌旗灯号对输入旌旗灯号在麦克风上的影响。该设备能忽视自身产生的音频,且无论扬声器播放何种内容,其都仍然能接收。实现 AEC 须要大年夜量的计算,个中在 DSP 中效不雅最佳。 为了实施唤醒辨认、波束成型和 AEC 等以上说起的所有功能,则请求 ARM 处理器合营 DSP 合营工作: DSP 加强了所有的旌旗灯号处理功能,而 ARM 处理器控制设备逻辑和接口。 DSP 可在履行输入数据管路方面发挥重要的感化,由此最大年夜限度地削减处理的延迟,大年夜而供给更好的用户体验。 ARM 可以自由运行如 Linux 等高等操作体系以控制其它设备。如许高等的功能全部产生在本地,若应用云办事,将只接收包含最终处理结不雅的单个语音文件。 结论 语音接口似乎已收成了超高的人气,并且将在将来很长一段时光内以不合情势涌如今我们的生活中。尽管有多种不合的处理方法可以实现语音接口办事,但无论你的应用须要何种装配, TI 都可认为你供给幻想的选择。
热点新闻
- 电位器和可调电阻的区别是什么? 2017-09-08
- 变频器电路板上的电子元件介绍 2017-09-08
- 快恢复二极管检测方法与常见故障原因介绍 2017-09-08
- plasma清洗技术相关介绍 2017-09-08
- 等离子体表面处理器相关结构和功能介绍 2017-09-08
- 油烟净化器用电源的连接方法介绍 2017-09-08
- 模拟电源、开关电源、数字电源的区别介绍 2017-09-08
- 模块电源之交流电抗器和直流电抗器有哪些区别? 2017-09-08
- 开关电源厂对通信电源电磁兼容性的分析与测试 2017-09-08
- 高频开关直流电源的保护技术介绍 2017-09-08