时间:2018-03-29 来源:互联网 浏览量:
近 日,微软亚洲互联网工程院推出新一代语音交互技术——全双工语音交互感官(Full-duplex Voice Sense),可提高人与智能语音助手之间的交互体验。
“全双工”本是通信传输领域的术语,意为双向传输,用在这里表示应用全双工语音交互感官技术后,语音助手在倾听的同时会和一位会思考的听众一样,“猜测”用户可能说的话,并实时生成回应。这项技术是微软亚洲互联网工程院的首创,其竞争对手亚马逊Alexa、谷歌Now都还未上线同类技术。
全双工语音交互感官的工作流程大致是:当用户用唤醒词激活语音助手后,他说的每句话都会被麦克风阵列接收并转成波形数据,然后由内置的算法将声音波形切分成若干段,再经声学和语言模型转化成文本,这些上下文相关的文本可以视为一串连续的向量,基于大规模语料库和机器学习模型处理后,AI程序不仅可以理解句子中的专有名词、谓语、状语等成分,还能通过N元概率模型或相似的技术预测出可能说的话。
比如,当用户的话:“我现在刚下班,XX路附近比较堵,怎么……”未说完之前语音助手就可以判断出用户在咨询其它通勤方式,然后话语刚落时正好就已经查询出了距离最近的地铁站在哪儿、该怎么走。若用户开放语音助手访问其历史记录,甚至可以预先规划好回家的路线并告知将要耗费的时间等。
应用全双工语音交互感官技术除让语音助手显得更智能以外,另一大好处是当预感到用户意犹未尽、接下来还有话要讲时,会让语音助手一直处于激活状态,免去用户反复说唤醒词、一句一句交流的烦恼,甚至反客为主,在交互陷入停顿时主动给与提示。这样,微软的新语音助手在交互形式上就非常贴近人与人之间的正常交流。
作为该项技术的开发者,微软亚洲互联网工程院2011年才在北京成立,但这并不是一个全新的部门,而是将原来的微软亚洲搜索技术中心和广告技术中心整合在一起,其研发方向主要涵盖微软必应(Bing)搜索引擎、在线广告技术以及移动互联网服务领域,最为知名的产品是微软小冰。
就在2月23日,微软刚与小米公司签署战略性合作备忘录,准备将Azure云服务以及AI技术运用到小米生态链产品中,其中就包括全双工语音交互感官技术,因此未来消费者能买到的第一个相关产品就是米家的Yeelight灯泡。此外,中国科技馆的小冰电话亭、日本本土化版小冰“凛菜(りんな)”以及一个还处于测试中的车载智能项目也已经用上了全双工语音交互感官技术。
联想到2017年11月微软同日本京东涩谷区政府推出的AI政务服务聊天机器人“涩谷未来(Shibuya Mirai)”,并争取到了世界首个人工智能程序户口,智能语音助手的服务范围越来越广,或许距离微软牌机器人的推出只是差具身体而已?