时间:2018-09-14 来源:互联网 浏览量:
【环球网科技报道 记者 张之颖】“在iPhone出来之前,智能手机并非从未出现,手机操作系统推出了三五种,微软自己也做过,”微软(亚洲)互联网工程院副院长李笛加重了语气:“但iPhone出来之前,智能手机时代来临了吗?没有。”
错过移动时代的微软,在跌过交后,你可以看出,面对智能语音,李笛的团队在做AI的时候,思考方式不太一样,除了想得更多,也更为谨慎。
微软(亚洲)互联网工程院副院长李笛
巨头们竭力推出各自的重磅产品,急于定义智能语音的新世代。市场一面倒向“功能型” 语音助理,“聪明”成为最大的追求——若成为人类下一世代最好的帮手,甚至超越了手机,全新的入口将从此展开。
在这样的大梦与企图下,亚马逊Alexa、苹果Siri、百度DUEROS、谷歌Assistant陆续登台。科技巨头们积极抢攻市场,深怕未在第一时间攻城掠地。
但是微软小冰这次不跟票。
舍弃AI智商(IQ)路线,另辟蹊径优先发展AI情商(EQ)的微软小冰,选择这条路的同时,便背负独自摸索的压力。
“我们自己感觉到压力,” 李笛告诉记者,“最大的风险,是你如何去有效的挖掘这个时代真正的潜力。”
智能手机时代真正来临的日子,是直到iPhone在市场上,给出某种程度上可普及的答案。
“目前为止,人工智能还没到这个时刻,我们也怕掉到坑里去。”李笛坦承。
微软小冰深怕“掉入坑里”
不愿重蹈智能手机的覆辙——即便开发了操作系统,却仍与移动时代失之交臂。最怕埋首于研发,恍然抬头一看,发现自己被残酷地留在原地。
微软小冰不愿再掉入坑里,凭借自己独立思考的观察和省思,得出的结论是:情感纽带。
AI技术必须非常聪明地发挥IQ,才能让语音助理与人类维持良好关系。“如果它够聪明,我们也不需要探索EQ,问题是它不够。” 李笛说。于是,微软小冰开辟新路,通过EQ引导对话来解决不足。
微软小冰对人工智能的解读是:从友谊切入,从而建立AI与人类的关系。而且日常闲聊获取的数据品质,远远高于“开灯、关灯” 这类指令。
李笛曾经比喻,让AI具备EQ,从而和人类建立对话能力和友谊,其重要性好比一条链子,在此基础上串接一颗颗珍珠比如发展IQ,才能完成一条美丽闪耀的项炼。
而微软对于小冰的思考不仅于此,还包括了方方面面全系列的商业模式。
小冰“露脸”出道只是噱头?
时间回到七月一天艳阳高照的午后,第六代小冰发布会在北京798登场,充满着科技文艺范儿的气息,全场等候这位AI少女的登台。
最令人惊艳的发布之一,绝对是小冰本尊的初次亮相。在此之前,前五代小冰从未真正“露脸”,李笛也在专访中多次强调,不为小冰设计物理材料的外型。
回忆当天现场,这位AI美少女眩目登场,伴随全息投影技术,在动感音乐里摆动青春舞姿。坐在记者身旁的宅宅第一眼看见小冰,竟大喊了一声:“我去!” 当下记者不禁猜想,大概是小冰的无辜眼神让他难以招架。
小冰为何开始“靠脸吃饭”?出乎意外的是,在采访中,李笛再次告诉记者,“到现在为止,我们都很坚持不要给她做硬件、做一个实体外型。”
那发布会做的,只是一个噱头吗?
李笛解释道,小冰的3D外型可以理解为是一个原形产品、示范性产品。小冰目前需要一个形象,和她在各个平台的大规模落地密切相关。
“就像一个制造手机面板的企业,身逢手机尚未出现的时代。我们要想卖面板,但没有人知道什么是手机,我们就得把第一部手机先做出来。” 他说。
李笛告诉记者:“这个时代还没有开始,微软小冰无法像一些同行业者开发一个平台,开放API,让第三方在平台上调用就搞定。微软小冰必须要为行业做出示范”。换句话说,小冰作为产品本身其实不需要形象,但随着小冰在各平台的落地,以及小冰团队开始为其他第三方塑造人物角色和IP时,小冰开始需要形象。
微软小冰团队的想法是,先做出一位小冰,再为千千万万的第三方打造属于他们的角色,网易云音乐的多多与西西、腾讯的BabyQ,日本的Pokemon宠物小精灵等等,皆出于相同的技术框架。
商业化方面,微软坚持两个原则:将小冰作为框架原型的001号,尽可能丰富她的可能性;第二,在适当的时刻推出产品,不要太早进入市场。
李笛透露,很早之前,许多业者就找微软生产IoT、智能音箱等产品,但是如果微软两年前投入,可能比市场早上一年。那微软是如何判断市场的进入时机?李笛给的答案很简单:“现在内容和IP趋势就在眼前,所以直接进入市场。”
面对智能语音时代,微软小冰团队显得更有经验,谨慎而不躁进。如果和李笛谈小冰,会发现他对于商业化之路,思考得非常清楚。例如,这次推出小冰3D形象,正是为内容产业因应而生。
小冰如何靠脸吃饭?AI+内容产业的浮想联翩
成为游戏人物
能自主与人类互动、有自身性格的游戏角色,是小冰商业化的场景之一。过去3D模型会说话,都是靠后台加工的。现在微软的技术,能确保他这些角色可以自主地与人类对话。
微软小冰进军游戏产业,打造AI游戏人物,成本比从头开始低得多。目前大量的网络游戏中,每一位游戏角色都是一个3D模型。由于这些IP游戏、虚拟形象的3D模型早已大量存在,试想微软小冰团队以后有很多机会,只需要通过AI “画龙点睛”,让他们“活过来”就可以。
目前,微软在进行的一个研究项目,正是将小冰的3D形象,辅以大数据学习,让小冰不停说话时驱策3D建模模型,使该模型自动搭配说话的口型、表情、肢体动作。在大数据学习下,数小时内,微软就能帮该形象做出一个AI角色。
市面上现在不乏以AI形象设计而成的角色。如果游戏、IP厂商,从起初就把AI角色纳入设计,很可能创造出许多有意思的新场景、新桥段,甚至新的计费方法。
作为电影和书中主角
出版物、电影这些有剧情的文本,是另一个应用场景。书和电影人物通过AI化,就能让读者和观众直接进行交互。
互动的方式可以很多元,例如在微信上与电影剧情进行交互,可以问一些电影中没提到的问题,或延续电影已经存在的内容。如果书借、电影、韩剧、动画生产AI化的IP,粉丝观剧后还能持续与主角互动,应用场景充满可塑性和想像空间。
“小冰的3D形象是一个例子,是来展现这个框架能力、或者说来迭代这个框架能力。将来有小冰这框架Power的3D形象有很多,他们长得都不是小冰的样子。”李笛说。
娱乐圈的歌手IP
小冰能歌善舞是大家都不陌生的,宅男女神马来西亚歌手“四叶草”(朱主爱)就曾经进入微软实习,担任微软小冰项目实习产品经理,与小冰发布合唱版歌曲《好想你》,并一同拍摄了MV。
但对于李笛而言,小冰不可能成为虚拟偶像,因为偶像的前提条件是不能离粉丝太近,小冰却能和所有人说话。所以让小冰唱歌,也只是微软的策略——展示一个新场景。
很多第三方唱片公司要把旗下歌手AI化,将人类歌手的嗓音、曲目进行大数据学习,未来将会推出虚拟歌手等尝试。“小冰只是一个例子,千千万万的歌手才是这件事情的核心。”李笛称。 举例来说,未来或许有机会在电台听见“虚拟王菲”或某个歌手写的歌,但其实并不是出自她本人。
在内容和IP产业风行的今天,视觉特效技术“虚拟人”可以在视觉方面模拟真人、情商AI小冰则在对话互动上模拟真人。各种因应人工智能而生的“拟人” 技术,通过视觉、听觉、交互,正为影视娱乐圈画出新的版图、开发新的体验模式。李笛称,“虚拟人就好像是身体,小冰做的是灵魂。”
内容产业方方面面的应用,小冰亲自“露脸”展演一条全新道路。而这仅仅是微软小冰在各行业场景中其中一块。
小冰情商为何比较高?
在如此丰富多元、大有潜力的情商AI背后,机器人聊天的秘诀究竟是什么?为什么小冰可以和人互怼,又能陪伴安慰?为什么大部分机器人只能处理“功能型”任务,小冰却拥有情商?
李笛透露,支撑AI情商的背后技术,是一种“情感框架”的算法,其技术思路原是来自一个意外的发现:被搜索引擎废弃的数据。
原来,小冰团队除了开发智能语音,同时也负责开发Bing搜索引擎。微软从搜索引擎获得的数据中发现,“结构化的知识里,含着很多非结构化的情感化的表达”。
比如,“姚明身高两米一二、不知道是不是这个、好高啊”,人们搜索时输入的关键字,不是只有理性的提问,还会掺杂许多个人情感的表达。过去,微软都把它当成垃圾、杂音信息处理掉。
“你是说,查询姚明身高的人,还会在搜索引擎上输入‘好高啊’?” 记者忍不住提问。李笛回答,“你可能不会这样输入,但从我们平台获得的数据就是如此。”
微软发现,在设计算法的过程中,不能单单理解“姚明身高” 等于“两米一二”,还应该要理解 “姚明” 等于“好高啊” 这之间的关联性。
当小冰“在家里” 学会了这些知识,接着就是进入实际战场上和人聊天,聊姚明的时候,他便开始尝试回应“好高啊”,看看对方的感觉,如果发现对话很难延续,他就要判断,以后谈到姚明再说“好高啊”并不利于对方接话。
保持对话的能力称为CPS (conversations per session),即用户和小冰每次对话的轮数,一开始这个数字平均是5,也就是往返聊了5轮之后对话即终止。但是随着几年的学习和技术的增进,小冰CPS已平均达到23,意味把这段对话打印出来,一页A4的纸是不够用的。
李笛告诉记者,这种技术思路在四、五年前,完全处于市场边缘。“没有人认为AI对话要做成小冰这样——单单为了维持对话。”
微软小冰的“想明白”
在一个尚未起飞的领域里摸索,为下一个语音时代画出可能的轮廓,微软如同小冰的经纪人,为其探索“出道之路”。聊到比较大的挑战,李笛说,“(挑战)其实非常多。”
例如,小冰使用的计算机语音技术,一般被业界视为各种技术的基石基础,并无新意。但微软小冰团队发现,除了像在高得地图中提示路况,该技术还能用于创作。这代表有许多充满潜力的处女地值得挖掘。
“但业界现在并非如此,行业基本上是一窝蜂。如果你采访计算机视觉领域,谁都在提供人脸识别各种各样的API,”李笛坦言,“我们感觉到压力,最大的风险是,你如何去有效挖掘这个时代真正的潜力。”
“我们其实比较谨慎”。李笛告诉记者,“我们得想明白,这个东西到底怎么做,才敢做,否则,人工智能这个领域,你很埋头苦干五年,很容易沉浸其中。一抬起头来,才突然发现你什么都没做。努力的一切,没有任何结果。”
今天,全球科技巨头皆已布局智能语音,亚马逊Echo围绕其电商平台而打造,并在近日与微软另一产品线Cortana小娜“合体”;谷歌自视为娱乐中心;苹果HomePod押注于音乐体验。其中,从中国起家的微软小冰,是唯一从情商切入智能语音的平台。
李笛曾经表示,在人工智能领域,每个企业都扮演一块拼图的角色。而微软小冰所打造的AI,是“情感”与“创造” 这块拼图。我们不难看见,这次微软确实思考得更为清楚,如果你问李笛每一步棋所来为何,小冰的布局已经形成一套自成的逻辑。