时间:2017-04-17 来源:互联网 浏览量:
微软实时语音翻译Skype Translator、必应搜索、微软小娜(Cortana)人工智能虚拟助手,这些大家耳熟能详的应用背后潜藏的对话翻译技术、知识编纂和语义理解等技术,无一例外都来自于机器学习的神奇能力。而眼下,这种智能正越来越广泛的进入更多第三方应用,成为人们日常生活中必不可少的环节。
在推进人工智能普及化的进程中,微软认知服务扮演了重要角色。它由25款工具集合而成,让毫无机器学习专业背景的开发人员也可在其应用中轻松添加诸如情绪识别、图像识别和语音识别以及语言理解等智能的功能。
认知服务的功能“微软认知服务集微软所有机器学习和人工智能之大成,通过易于使用的API将它们提供给开发人员,免去他们从无到有的自创技术之苦,”微软雷德蒙研究院语音及对话组首席研究员Mike Seltzer说。“在大多数情况下,建立一个先进的机器学习模型需要巨大的时间、数据、计算投入和过硬的专业背景,”他解释道。
微软认知服务功能十分强大,它可帮助开发人员将智能技术应用于图片和视频等视觉数据的处理上,企业及机构用户则可以用它来强化各自的服务。例如,帮助组织机构搜索闭路电视和安防摄像头所拍摄的内容,从而寻找特定的事件、物品和人员。
微软人工智能及微软研究事业部全球资深副总裁Andrew Shuman指出,整套认知服务工具集发端于微软普及人工智能的愿景,旨在将微软在人工智能和机器学习领域的专业知识广泛地提供给开发社区,为最终用户创造更加愉悦和强大的体验。
认知服务给人们带来的新体验以游戏为例,大部分玩家总是抢着尝试有最先进图形及技术创新的最新游戏,追逐音响和视觉效果更佳的时髦玩意儿以及将剧烈的身体动作转化为屏幕上角色行动的新交互方式。但是近年来,来自新体验的劲道正在减退——计算能力的成倍提升并未带来游戏兴致的倍增。
这个问题催生了一次新一代虚拟现实技术的演示。Human Interact公司创立者Alexander Mejia开发了一个应用新一代虚拟现实技术的头盔,让震撼的游戏效果重回玩家眼中。
为了实现真实而快节奏的动作,Mejia和他的同事需要准确和响应敏捷的语音识别功能。“一定要做到这一点,任何人在任何时候说的任何话,【语音识别引擎】都要能够理解,并且沿着脚本中正确的路径运行,”他解释道。他随后补充说:“这,就是微软认知服务的魔力。”