时间:2017-08-03 来源:互联网 浏览量:
诞生三年的微软小娜(Cortana)已然成为微软AI战略的重要组成部分。
近日,微软小娜在移动端发布了重要版本更新,首次在iOS平台上增加了锁屏插件功能,即可以在锁屏状态下查看来自小娜的各种消息提醒。该版本支持小娜账号与微软所有办公软件账号实时互通,使得跨平台协作更加高效和便捷。
这也意味着,小娜助理功能的重心正在从生活场景向工作场景扩展。
Cortana是微软发布的首个个人智能助理,也是这家公司在机器学习和人工智能领域的尝试。按照微软最初的设想,小娜与用户的交互方式不仅仅针对于问答,而是在对话基础上利用云计算、搜索引擎等来读取设备中文本、邮件、图片、视频等数据,从而实现人机交互。
Cortana中文版则在2014年发布,并赋予其“微软小娜”的名称和可爱的面团形象。2015年12月,微软推出了可跨平台移动版小娜应用,开始支持安卓和苹果用户使用。
从竞争的角度,过去大家只会把苹果和谷歌的语音助手与Cortana对比。但现在看来,亚马逊的Alexa,以及国内的百度、阿里、腾讯等等都已经加入了这场AI战局,各家都在尽力为自己的平台拉拢更多的硬件合作方。
“我们非常在意如何能让小娜这样的人工智能助力我们的工作和生活,能够将其运用到不同的跨平台和跨场景上去,例如智能硬件、增强现实等方面。”微软亚洲互联网工程院常务副院长幺宝刚在接受媒体采访时表示。
公开资料显示,幺宝刚此前曾在微软美国总部任职,先后任开发经理、开发总监、部门总经理职位。更早些时候,还曾担任谷歌中国工程研究院副院长。现在幺宝刚最主要的职责是,负责微软亚洲互联网工程院在人工智能、互联网搜索及服务、移动搜索及服务等领域的产品及技术开发。像小娜的移动端版本便是由他直接负责。
据幺宝刚透露,小娜发布三年来,已经在全球拥有1.45亿用户,与用户的对话数量高达120亿条。他没有透露小娜在不同设备端的具体用户数,也没有就不同地区的小娜市场占有率做详细介绍,但这家公司希望每个人都能用小娜来提升人们的工作和生活效率。
这显然不是一件容易的事情。
由于小娜基于Windows生态系统开发,在该系统之外的安卓和iOS平台上,小娜需要受到相关系统条款和数据读取限制,很难实现一些原本看上去非常强大的功能。例如可在用户邮件中提炼重要线索,适时建议用户设置提醒。
据界面新闻记者了解,目前iOS端的微软小娜尽管也可关联outlook、exchange,office365等账号,但仅支持英文邮件和场景的检索,中文检索还要等待一段时间才能实现。安卓端的情况也是如此。
也就是说,安卓和iOS平台上的小娜,更多聚焦在查询天气、查看新闻以及闹钟和事件提醒等较为基础的功能,暂时无法像在Windows设备上那样用语音直接唤出小娜,实现更智能化的人机交互。
但这并不能阻碍小娜的持续优化,并通过与硬件厂商合作来扩展其在其他平台和场景的影响力。
在热闹的智能音箱市场,微软也不甘落后,在今年5月与知名音箱厂商哈曼卡顿联合推出了智能音箱Invoke,计划秋季在美国市场正式发售。该音箱内置的智能语音系统正是小娜。
尽管在发售时间上落后亚马逊的Echo和苹果的HomePod等智能音箱,但微软认为,借助小娜三年多的数据积累和对用户反馈的了解,Invoke具备自己的优势。
“我们的定位不是娱乐化,而是效率为先。”幺宝刚强调,这样的选择与微软一贯在提升生产力方面的投入有关,也与对应的客户群体有关。“这是其他同行不一定有的优势。”
而幺宝刚口中另外一个优势则在于以必应为首的搜索引擎技术。他认为在人工智能领域,搜索引擎是知识的重要来源之一,而必应在美国所占的市场份额仅次于Google。“通过这些年的研究,我们已把知识图谱建立的非常完整。“这些都给了微软不少信心。
对于智能音箱的盈利问题,微软并不急于求成。这家公司认为目前所有智能音箱设备,最需要解决的是准确找到用户群,其次才是盈利。
但智能音箱只是小娜商业化应用的方式之一,微软正在尝试实现更大范围内的应用。
一方面,微软需要让小娜的技能变得更丰富、更有用,这就要求微软必须与提供相关技能服务的合作伙伴一起来做。而另一方面,是将小娜的技术开放给合作伙伴,帮助后者开发出更好的产品。
据幺宝刚介绍,微软已经与一些汽车厂商谈过合作,包括沃尔沃和日产等,让小娜进入这些品牌汽车的车载系统,此外也在接触部分国内手机品牌,但具体品牌名称不愿透露。“我们注重用户整体的体验,无论是在家里、公司、路上,都能通过小娜来实现效率提升。”
在微软内部,也在进行着一系列以小娜为核心的调整。
2016年,微软将人工智能相关技术研究的部门,例如计算机视觉、计算机语音研究,以及语音产品和必应搜索、必应知识图谱等平台,全部整合在一起,形成一个上千人的团队。
这些团队直接或间接为小娜服务,像小娜采用的语音识别技术便来自于语音部门,其错误率大概为5.9%,在业内也算是比较领先的。接下来微软计划进一步降低错误率和容错性。容错性是一项针对不同环境场景的语音标准,要让小娜无论在安静房间还是嘈杂环境内,均可以识别出多个声音中具体是谁在说话。
微软的确有着丰富的人才资源,也因此常常被外界戏称为AI人才的“黄埔军校”,不少BAT人工智能项目的负责人便来自于微软。
对于上述人才领域的竞争,幺宝刚觉得是好事,代表着微软为行业所做的贡献。但他也强调,人才交流是双向的,也有很多来自BAT公司的人才进入微软工作。
但不管行业、组织架构和人才如何变化,幺宝刚称小娜会一直围绕提升效率不停的做下去,这也将为微软在人工智能领域的深入带来更多机会。