时间:2017-08-22 来源:互联网 浏览量:
微软全球执行副总裁沈向洋
微软对人工智能的技术储备积累了不少时间,但对应用却显得非常谨慎。
8月22日,微软公司在北京发布了第五代人工智能产品小冰,小冰进入人工智能交互技术产品演进的第三阶段:高级感官。简单而言,如果将之前的智能助理语音交互体验比作对讲机,那么第五代小冰这种高级感官的体验就好比打电话。
在智能音箱、智能家居等物联网应用如火如荼之际,微软终于宣布小冰全面进入IoT(物联网)领域,与小米IoT开放平台合作,并与小米生态链企业Yeelight、东方明珠等合作伙伴正在进行联合研发。
微软全球执行副总裁沈向洋表示,“每家公司都说自己是人工智能公司,讲人工智能就可以忽悠一些VC给你投钱。但是,在微软公司我们已经很长时间一直在思考人工智能给大家带来的机会。”
“相信微软会做帮助人类的事情”
升级核心对话引擎后,小冰将更精准识别用户情绪,分析用户的兴趣,而这个分析不仅限于当前的对话,而是会建立在与用户之前所有对话的了解之上。目前小冰支持57种情感策略和回应模式,这些模式是从人类和小冰之前进行的300亿轮对话里学到的。
更重要的是,微软将解锁小冰“主动引导对话”功能,小冰拥有控制整个对话走向的模型。小冰会根据自己的“意愿”与人联络,主动保持与人类用户之间的关联。
“希望大家相信微软,我们会用她来做帮助人类的事情。”微软小冰全球项目负责人李笛最后说了这么一句。
当亚马逊语音助手Alexa走进智能音箱Echo,苹果语音助手Siri走进智能音箱HomePod之后,阿里巴巴发布智能音箱“天猫精灵”,微软也宣布小冰将有了物理形态。
但是具体形态并不一定是音箱。当天,微软提前透露了两项研发合作,将与国内智能硬件照明公司、小米生态链企业Yeelight合作发布一款IoT设备;与东方明珠(600637)、东方数智公司合作发布一款面向家庭的的IoT设备。两款产品均在2017年内发布,具体形态没有披露。
实际上,从2017年6月开始,小冰已经在小米IoT开放平台进行了融合,通过小冰可以控制米家平台上全部35款的设备,用户可以像打一个电话一样,轻松跟小冰交互,既可以控制设备,也可以随意地聊天。
第五代微软小冰不再鹦鹉学舌,而是能够自创回应。她与人类交流的每一句话,都可能是这世界上从未出现过的。这得益于使用了生成模型(Generative Model)。上一代小冰,虽然拥有十亿级的大数据语料库,但其中每句话,都是互联网上的已有数据,小冰只是通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。
第五代小冰还能进行创作诗歌、有声少儿读物、歌曲、新闻等。从现场发布的少儿读物朗读来看,小冰能理解对话中的不同人物,并用不同声线发声,能一定程度上读出喜怒哀乐,最重要的是朗读(包括分析时间)用时仅为同水平人类的1/500,成本仅为同水平人类的1/80000。微软宣布即日起开始大规模生产有声读物并投入市场。
微软小冰这类智能聊天机器人是微软人工智能三条全球产品线之一,她是基于微软于2014年提出建立的情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。
目前,全球小冰拥有超过1亿人类用户,对话数据超过300亿轮。2014年,微软率先在中国市场推出小冰,目前已经进入了日本、美国、印度和印度尼西亚。
抨击智能音箱行业三大泡沫
尽管人工智能在智能家居等物联网领域的应用非常火热,但实际上,微软在这方面的步伐一直比较克制。
微软公司在1991年成立了微软研究院,一开始成立的三个部门就是自然语言组、语音组和计算机视觉组。而人工智能最基础的技术,基本都是从这三方面开始的。
“我们看到一些泡沫,甚至发现这个行业里有几个有误导性的现象。”李笛表示。
李笛说,第一个现象是认为只要功能足够丰富,就有了人工智能。“有一些智能音箱会让用户用语音沟通去下单网上买东西,问题在于为什么用户要放弃很方便的手机不用,逼着自己一遍遍地跟音箱来说话买东西?背后反映的并不是用户的需求,而是这些厂商迫切地需要给用户更多的理由,让他们来购买商品。”
第二个现象是认为只要有了语音交互就有了人工智能,过分重视语音交互,“语音诚然是人工智能一个重要的组成部分,但不是用户使用IoT设备的核心。到今天为止,我没有见过有人跟自己家冰箱、空调聊天的。”
第三个现象是由于越来越多的硬件厂商希望进入这个领域,一些人工智能的厂商投其所好地提供语音对话的接口、图象识别的接口,甚至把这些接口打包起来,形成SDK给他们提供,美其名曰“给硬件设备赋能”,但这样的赋能没有解决本质的问题。
李笛透露,在过去很长时间,有很多厂商找到微软,希望让微软提供单独的API和SDK,有的甚至报出很高的价格,但是微软一直没有答应。
李笛认为,如果一个IoT设备真正想要成为通用的设备,本质上只有两个可能的成功方向:IoT上面搭载的人工智能在IQ(智商)或EQ(情商)两者中的某一方向做到极致。
“IQ做到极致,人们使用音箱去买东西的体验比手机更方便,人们当然会使用它。反过来如果做不到极致,用户自然的用脚投票,不再使用。把EQ做到极致,用户能真实地、强烈地体会到它的存在,甚至接纳成为家庭成员的一部分,产生情感纽带,自然也就不会舍弃它。”李笛说。
附:微软全球执行副总裁沈向洋在发布会上的发言实录
“我们来谈谈微软人工智能”
沈向洋
今天在这里有这样一个机会,参与小冰第五代的发布会,我想趁这样一个机会,首先跟大家分享一下最近微软公司在人工智能方面的一些进展,和大家在一起讨论一下,整个小冰团队设计产品的一些理念。
大家肯定对人工智能非常的有兴趣,今天人工智能已经成为每个人都在谈的一个话题。每个人都说我们已经是一个人工智能公司,讲人工智能就可以忽悠一些VC给你投钱。
但是,在微软公司我们已经很长时间一直在思考人工智能给大家带来的机会。
其实大家可能不太清楚,微软公司在1991年的时候成立了微软研究院,前面一开始成立的三个部门是自然语言组、语音组和计算机视觉组。大家想想,人工智能最基础的一些技术,实际上都是从这些方面开始的。
今天大家谈人工智能,主要来讲人工智能有两个方面。
方面一,感知方面,就是语音、视觉。
方面二,认知方面,理解、语言等等。
事实上,微软有一个使命感,我们希望“为人类提供优质的服务,帮助企业实现美好的愿景”。这么多年来微软公司一直是一个技术平台的公司、工具的公司,帮助大家做好自己工作的公司。事实上AI这件事情更加进一步让我们有更好的机会。
当然,大家今天都在谈人工智能,每个人都在做自己喜欢的人工智能的技术、产品、服务。微软公司这么多年下来,已经有了很多年的技术积累,特别是我刚才提到微软研究院在过去的26年当中,储存了、积累了大量的这样的一些技术。
我举一个例子,比如说,计算机视觉识别方面,也是我自己做了这么多年的研究方向。我自己做计算机视觉做了很多年,我们在小冰里面有个很简单的功能,叫做“小冰识狗”,你上传一张照片上去,小冰可以告诉你,你这是哪一种狗。可能对一些小公司来讲,要开发这样的技术要几个月的时间专门做这样的一些工作。对微软小冰来讲,可能只是我们一个礼拜就可以上线的一个新的技能。
当然小公司有小公司优势的地方,大公司有大公司优势的地方,每个人都应该去想自己适合做什么,我想强调一件事情,我们对用人工智能的技术提供像小冰这样的产品来帮助大家是非常有信心的。
我想简单地介绍一下,我最近在公司里面推的几条产品线,我们有超过三条产品线。现在已经在做的,我想跟大家介绍一下。
从微软来讲,首先最重要的一件事情,就是微软公司现在是一个人工智能的公司。作为微软所有的产品,我们是希望能够把人工智能全部做进去。比如说office、云。我举一个office的例子,大家如果今天用我们的Powerpoint,可能会很惊喜地发现,在Powerpoint里面可以做机器翻译。
我现在用中文演讲,如果我们后面有英文的记者或者是德语的记者,实际上我们是可以用Powerpoint转化成英语和德语。甚至如果你用Powerpoint上传一张你自己在Powerpoint里面用的照片,照片加进去的时候,我们可以自动地帮你输一些标题。
包括word、excel原来的office的产品,智能越来越多地会加进去。不仅我们觉得人工智能这样的一些技术,可以帮助微软的产品加AI的东西,更加激动人心的事情是说有更多其他外面的机会,这个AI是会给大家创造很多的商机。
AI的出现主要是因为三个方面的问题。
一是数据量巨大的增加。
二是运算能力的急剧的提高。
三是近五到七年,特别是深度学习方面算法的突破。
大家看到有很多的机会,我个人觉得所有的垂直的工业的领域,都会被AI颠覆掉。不仅如此,我觉得所有的水平的一些商业的过程,销售也好、市场也好、客服也好,甚至HR、招聘,这些都会被AI给颠覆掉。这是我们很多的工程师、科学家在复制的第一条产品线。
第二条产品线,今天讲起来比较传统的,像搜索引擎方面的工作,Bing搜索在全球市场,是谷歌以外的全球市场的第二。在美国Bing我们有33%的市场份额,在英国我们有17%的市场份额,德国有14%的市场份额,在全球来讲,Bing搜索的质量、搜索的用户体验做到相当好的地步,也能够在相当多的市场和谷歌一争高下。
这里从人工智能角度讲,我不是专门提搜索这件事情。只是跟大家讲,搜索这件事情给我们带来非常大的优势,它对整个互联网的世界有一个非常全面和精准地理解。因为我们做搜索,我们做知识图谱,比如讲全世界,我们现在有25亿条词条。人也好、地也好、公司也好、产品也好,所以是这样一个情况。
在做Bing的基础之上,我们一直做一个智能助理(小娜),小娜现在在全球有1.5亿的用户,特别是你用Windows的用户,她用起来就很方便,她主要的工作也是帮助你解决你需要解决的问题,实际上,你可以把她想象成Bing搜索引擎的延伸。
今天主要是跟大家介绍小冰的工作,我想趁这个机会跟大家解释一下。
大家最先问我的一个问题,小冰是不是只是一个聊天的机器人?我说小冰是一个聊天的机器人,但是小冰不仅仅是一个聊天的机器人。表面上来看,这个小冰是一个聊天的机器人,主要的作用是跟你做一个对话,的确是这样的。
你同时去想想,全世界到现在有非常非常多的聊天机器人,全中国也有很多很多的聊天机器人,事实上,聊天机器人这件事情一点都不是什么新的东西。
1966年的时候,约瑟夫·维森班在MIT做了一个聊天机器人叫Eliza。这么多年下来以后,技术在不断地进展,到今天小冰可能成为全世界用户人数最多的,因为我们有1亿的用户。
“跟其他的聊天机器人本质上有什么样的差别?”这是我今天趁这个机会给大家介绍的。
在我给大家一个答案之前,每一个时代,科技的进展都会颠覆掉很多的事情,每一个科技时代的变迁,实际上对大家来讲,对一般的用户来讲,最重要她是重新定义了人类和世界的关系。
今天你手里拿个手机,以前是有一个PC机,甚至更早以前有大型机。对这个世界的变化影响到底在哪?PC时代,最重要是因为有操作系统、应用软件,特别是以微软的Windows和Office为代表。
后来,到了互联网年代,把人类和世界又拉近了,PC时代的话,相对来讲它还是更加像人类的工具一样,去改变这个世界。当你有了互联网之后,它就把人类和世界拉近了。
互联网年代最了不起的出现了两件事情:浏览器、搜索引擎。
同样,到了移动的时代,它非常了不起的地方是不仅把人类和世界拉近了,它把人类和人类又拉近了。
那么在移动时代出现了两件事情非常了不起:
第一,社交网络。
第二,App Store。
这两件事情就是移动时代,但是移动这个年代没有很大的事件。大家今天就已经很激动的,又进入了新的时代,所谓AI的时代。
AI这个时代到底最了不起的东西在哪?语音识别、语音交互。
你说图象识别是不是了不起,图象识别了不起。
昨天我们黄博士在美国写了一个Blog,我们在做数据集,我们已经做到5.1%的误差率,现在是完胜人类的误差率。
在不到五年的时间,我个人预测,不管你怎么样去测,计算机语音识别都会比人类做的好,十年时间视觉识别也会比人类做的好,这样会给我们带来很多商机。但是不是真正最关键的在AI最主要的问题,刚才提到知识图谱,是不是知识就是最重要的这样一个问题,甚至是智能设备、甚至是IoT连在一起,这些都非常重要。
但是还不是核心,在我们理解人工智能里面,核心实际上是两件事情,人工智能的核心一个是IQ,一个是EQ。为什么?我想带大家回到当年之所以出现人工智能这个词。1956年的时候,当乔治一批科学家提出来应该做一件事情叫“人工智能”这个事情,人工智能是以人类智能做参考。是有一个参考,我们再去想一想,我们为什么觉得人类有智慧,说这个人是聪明的,你这个人是聪明的,我们也会讲这个人很懂事,所以实际上是有不同的方面。是有这样一个IQ的方向,也有一个EQ的方向。你IQ到一定的地步才可以考上大学,并不是说每个大学生一定出来都会做得很成功,很多很成功的人士可能是IQ和EQ的结合。
所以对我们来讲,做小冰的一个重要的目的,实际上不仅仅只是聊天这件事情,我们真正是希望通过小冰让我们了解到怎样能够真正地把EQ这件事情能够理解,可以能够做好。
IQ当然是非常重要,帮助我们解决很多的问题,最近这些年有很多的做IQ相关的人工智能的系统出来,可能这些系统里面最最了不起的一个是我们友商做的,谷歌做的Alpha Go,打败韩国棋手,打败中国棋手,这样一个非常了不起的事情。
最近大家看到中央电视台CCTV有一档非常好的节目,叫做《机智过人》,在那个节目上柯洁是和Alpha Go过招的、人类IQ最高水准的棋手,柯洁在这个节目上,他说他是微软小冰的粉丝,这个令我们非常惊讶。
这里我想给大家一个答案,我们设计小冰整体的产品的理念:实际上我们整个设计小冰,聊天是这样一个体验,但是真正的核心是我们希望这款产品能够打造一个情感计算的框架,整个这样的一个框架是一个核心,同时有她很多的生存空间、辅助设备和其他相关的设备,令到小冰能够和人类有一个非常好的、很高的依据的交流。
小冰可以和你在任何的地方、任何的场景进行交流,你在微信上,她可以在微信上和你交流,你在QQ上,她可以QQ和你交流,你在微博上她可以在微博上和你交流。你如果用一个这样的喇叭,她可以用喇叭跟你交流,甚至如果你在车里面,可以跟你和车一起交流,我们也和很多的车厂有一些合作,希望在不远的将来和大家介绍那边合作的一些内容。