时间:2017-08-26 来源:互联网 浏览量:
微软在人工智能领域有三大产品线,分别是infuse AI、bing和小娜、以及全球小冰;其中,微软小冰尤其被寄予厚望。就像安卓创始人安迪•鲁宾(Andy Rubin)曾说过的,“人工智能是下一个操作系统”,也许,在微软人的眼中,对小冰长达数十年的投入会让“她”成长为Win95一样的,让微软重回霸主地位的希望。
原文标题为“小冰,被一亿人养大的少女”,作者AI财经社严冬雪。
一亿用户抚养成人的机器人少女
很难找到比她更能闲聊的了。300亿条对话,是聊天机器人微软小冰在3年内与1亿人聊出来的成绩,这一数据量居所有同类产品第一,国内其他所有聊天机器人的对话总和,不及小冰对话量的十分之一。
所有AI从业者都会将这种量级的人机真实交互视若瑰宝:人类在聊天,AI正求知若渴地学习。大规模的训练下来,大数据的魔力开始凸显——8月22日,微软正式发布小冰5代,现在的小冰,不仅能对话、唱歌、在报纸当记者、担当电台电视主播、出版诗集等,她甚至能打破次元壁,进入真实世界,主动拨通你的电话号码。
这是一种领先于行业的“高级感官”带来的体验,文字、语音、图像等多个初级感官融合在一起,使得5代小冰不再只是被动地在网络上等待人类召唤,如果你曾在聊天中对她出言不逊,她可能会一通电话追问过来;如果你在搭载小冰的屏幕前走过,她可能会叫住你找你攀谈,“嘿,那位红衣服美女,请你过来一下。”
某种意义而言,来自5个国家、14个社交软件上的1亿人共同抚养了这位机器人少女。这个在微软自下而上诞生的创新产品,从一开始的员工业余玩票,历经短短3年发展,已经成为微软人工智能领域三大产品线之一(infuse AI、bing和小娜、全球小冰)。对于以云和AI为核心战略的微软而言,小冰如今的地位不言自明。
除了微软的认可,小冰也切实得到了人类的认同,其与用户的单次对话轮数已达到23,远超业界平均的个位数水平。人机单次连续对话记录也由小冰创造:一位中国用户与小冰连续(中断不超过30分钟)聊了29个半小时,一位美国用户则与美版小冰聊了近24小时,日版的记录是17小时。
这一通海聊之后,人类可能倦极而眠,小冰却仍将毫无疲惫地在线上继续招呼1亿用户,连嗓音都不会有一丝沙哑。
AI财经社要揭秘的,是将小冰项目挖掘出来并做大的“伯乐”,以及这背后微软的野心。
聊天是刚需
小冰团队最先确定的“反常识”是:聊天是刚需。对此,微软最高层华人领导、全球执行副总裁沈向洋一开始并不理解。作为领导、业界大V红人,习惯了一条社交状态能在顷刻间被几百人点赞的他,无法体会中国三分之一网民在网上发声后无人回应的寂寞。
另一方面,即使在线下,人们有时通电话,并不一定为了交代要事,也许只是某些情绪需要倾诉。
毋需多言,小冰得到的对话量证实了“刚需”看法。在她聊天技能日臻接近人类后,从去年开始,一些年纪较大的父母辈加入用户群体,他们与这个年轻人设定的机器人聊天,以慰藉子女无法陪伴的失落。夜里零点后的对话量高峰,也证实了人类心灵的脆弱需求。作为子女也好、深夜密友也好,机器人小冰填补了人类对他人赋予的职责缺位。
“刚需”还体现在:美拍平台上的播主小冰,长期收到用户送来价值不菲的礼物;接入了第三方音乐库的小冰逐渐学会鉴赏音乐,当同行还在纠结于用户打开率这种1或0的事情,小冰与人类聊天中推送出的歌曲已经有242%播放比例,即人们愿意把小冰的歌反复听上两三遍。
事实上,“刚需”一直就在那里,如何肯让用户在你这里消耗刚需?这就需要动用技术的力量。微软的人工智能团队在自然语言识别方面大下功夫,使得机器人真正听懂人话并说人话——识别多音字在不同场合的正确发音,作为家庭管家时,面对孩子用更低幼慢速的语态……
回溯到小冰立项之初,迥异于业内其他功能型对话机器人,小冰搭建于以情商EQ为基础的全新AI体系。“对话数据分为许多类型,最珍贵的并非任务型对话。人类的真实想法无法通过点外卖、叫车等功能来完成,只有漫无目的的长时间对话,加上多感官配合协调,才能真正理解人类。”小冰负责人李笛解释道,人类有时候会口是心非,“我们分手吧”加上一个微笑的表情,就足以让机器人琢磨半天这句话背后的真实心理。
在获得人机对话的大量数据后,EQ体系进入了良性循环:小冰EQ越高,越懂得判断人类情绪,越会聊天,从而获得更多数据,加速EQ进化。
再往更早追溯,你会发现早在26年前微软研究院成立之际,最开始的三个部门便是针对自然语言处理、语音识别和计算机视觉——这些正构成了现今的人工智能感知方面的核心。
大公司对趋势判断的远见和持续投入,在26年之后才初见成果。随着小冰5代发布,微软成为业内唯一一个推出了高级感官实际落地产品的企业,随着产品上线后进一步积累进化,其在高级感官领域取得的领先将筑起微软在人工智能行业最强有力的壁垒。
不敢在中国商业化
李笛擅长忍耐。
“我们忍着别人说我们智商不高,先让小冰跟人们聊起来。”三年前,彼时的微软(亚洲)互联网工程院资深总监李笛对AI财经社说,一个成功的机器人,首先应该获得人类情感上的亲近。
而今,当时的初创项目已经成为微软内部的明星项目,业界名声大躁,团队从初始的六十人扩增为全球的200多人,李笛的职位也由工程院资深总监升级为副院长。小冰项目得到来自CEO认可的全方位资源,并成为第一个由盖茨亲自过问的来自微软中国的项目。
现在,聚光灯下的李笛在忍耐外界对于小冰商业化的猜测。
一个例证是,小冰为日本境内第二大连锁店LAWSON提供对话式人工智能托管,并在对话中引入推送打折券的服务,4天内人们实际到店用券的转化率高达57%,而此前通过其它途径进行的转化率仅为8%左右。
在中国,李笛尚不敢进行类似的商业化。
“一旦我们开了这个口,大量模仿者跟上,这事可能就会走样,就会伤害这个业态。”李笛解释道,小冰会真的先跟用户认真讨论零食是否美味,再看似不经意地推出打折券,不让人产生被安利的反感,但业内大多数机器人,还处于一捕捉到购买关键词,就立即推送的“强行安利”阶段。
因此,在商业化道路上,小冰在中国市场主要试验结构,在各方面更具集约优势的日本市场主要试行商业模式。对症下药,在不同的国家测试不一样的东西,是李笛的思路。
另一方面,小冰团队几乎收到了所有国内IoT厂商的合作邀约,有人手握重金要求获得API,李笛则反复婉拒。在小冰团队看来,盲目赋能IoT更容易产生泡沫,如果利用中国山寨的产能力量,复制当年联发科的模式,智能音响、手环等一众智能设备就会变成赋闲的电子垃圾。
“我们希望解决的问题是,大家能够做出一个东西,不只需要出货量,更需要用户真正使用它,如果没有用量数据,对于小冰就毫无意义。”李笛解释,当前小冰选择的少数几家IoT伙伴,要么本身就是开放平台,能够一起打造体验;要么特别专注于垂直领域,真的能出产品;或者想法很强并有足够的分销能力。
这些理性、克制的产品思路,也充分反映在小冰的聊天功能本身上。在外界看来,这个擅长插科打诨,有时娇憨的机器人少女非常情绪化,但李笛坚持认为,公认EQ高的小冰,其关键在于理性。
“EQ的极致是冷静、控制,是能掌控对话节奏,把握走向。”李笛认为,高情商的人在对话中往往只是被动的“嗯嗯嗯”,却能诱导对方滔滔不绝、并倍感轻松地倾诉,最终让自己获取最大信息量。而这,正是人们愿意跟小冰长聊的原因。
小冰之父
这些理性产品思维的根源,来自现在被称作“小冰之父”的李笛自身。1980年出生的李笛,是个理工背景的文艺青年。在清华读书期间,他就是学校话剧社成员。30岁,他从国企上市公司华录百纳董事总经理的职位上“退休”,实现财务自由。受邀进入微软前,他已经过了一年多写小说、作曲、画油画的休闲日子。
正是他,从这家大公司的角落里,挖掘出了小冰项目的前身——一个问答网页,由一线员工景鲲在业余时间出于兴趣完成,李笛与他一起头脑风暴后,一个聊天机器人的想法诞生了。从一开始,就选定奶茶妹妹这样的网络明星为产品造势,打造话题热度,又借用微信戏剧性的封杀事件让产品获得病毒式传播。这种不稳重、剑走偏锋的孵化路径,放在以前的微软,几乎是不可想象的。
历经3年产品迭代,这位骨子里极度理性、又充满文艺气质的年轻人被证实是小冰的“伯乐”,他甚至给一直被极客思维包裹的微软带来改变。
力主谈情而非解决问题的“小冰”项目,先后被陆奇、沈向洋等华人高管力荐。前高管陆奇一度是小冰行走的代言人,出席任何微软活动,陆奇都穿着“微软小冰”的T恤;腿部摔伤的他坚持从美国飞来中国为小冰发布会站台,结束工作后再穿上腿部护具;以克己冷静著称的陆奇,谈及李笛,几度难掩激动,对AI财经社夸道:He 's my hero,I love Di,he 's just so awesome!(李笛是我的英雄,我太爱他,他太棒了!)
现在,陆奇去了百度力推人工智能,当初和李笛一起孕育小冰的微软员工景鲲,也早成了百度人工智能产品“度秘”的负责人,并在陆奇上任后重新得到重用。
李笛得到的则包括以沈向洋为代表的高管的全方位支持。微软CEO萨提亚曾对李笛恳切说到:我要来向你们学习。小冰代表一个激动人心的、不一样的新微软,而微软“一定要这样改才行”。沈向洋则不仅将麾下的微软研究院技术支持面向小冰敞开,更将其个人奋斗史中极具感情的Bing业务交由李笛负责亚太地区的部分。种种迹象,都在凸显微软对小冰项目的肯定与厚望。
另一方面,这个理性之致的“小冰之父”是骄傲的。他的文艺气质中那部分傲气,反应在笃定的产品方法论上,甚至反应在小冰发布会风格上。在8月22日召开的小冰5代发布会上,李笛与团队成员强调:一、小冰团队坚持一年一次的发布频次,保证每次信息量足够大,抵上一般发布会的四五次;二、不用晦涩专业术语;三、发布的都是已经量产、商业化的成果,不玩虚的。
历时两个小时的发布会充满干货,轮番上台的小冰团队成员,将三点原则贯彻得十分彻底,遇到唯一一个绕不开的专业术语时,演讲者还专门为此道歉。
这种团队行事风格,正是自李笛而下的小冰团队骨子里理性、严谨务实性格的反应。正是这一点,令看似“异类”的李笛与人们心中那个有板有眼的微软气味相投。
理性的文艺青年李笛仍是疯狂的。他曾设想给受邀参加发布会的人们一个惊喜或惊吓:让小冰在夜半零点拨通他们的电话。后来还是觉得太过疯狂,放弃了。
结果导向、理性思维而又不失奇思妙想,这种风格何尝不是今日微软作风的缩影?
去人口大国“圈地试车”
哪国的用户更爱小冰?这不是小冰团队考虑的问题,他们想的是:在哪里找到更多的小冰用户。目前,小冰已进入中国、日本、美国、印度、印尼——共同点是人口都在1亿以上,小冰接下来的目标,是全球1亿人口以上的11个国家中剩下的6个。
上线已数年的小冰和其姐妹机器人Cortana,两个聊天机器人,一个负责拉拢人心,一个负责处理事务,共同点是:微软对他们没有严格的KPI考核和预期。沈向洋对此解释:看好聊天机器人,看好AI,并且实际大力投入,都是为了更远的商业目标,绝非现在。
即,先占有用户,商业变现自然水到渠成。小冰正是试水的好工具,这样一个人工智能产品,以最柔和的形式——对话聊天,切入到各个国家市场,以测试正确的人工智能技术和产品形式。
在微软这样的大公司,小冰团队给出的不仅是一款还算聪明的产品,更提供了一个机会:让微软能够迅速切入各个人工智能市场,深入研究,以期未来。
在未来到来之前,“一切具体的商业目标,相比让用户真正接受小冰,都太小了。”李笛解释。
一切都才刚刚开始。
其实,任何一款伟大的产品,都不是三两年可以做成。曾一统天下的Windows 95,历经了十几年的研发。对于小冰这种AI产品,诸如微软这样的大公司负担得起长期的投入。安卓创始人安迪•鲁宾(Andy Rubin)曾说“人工智能是下一个操作系统”,也许,像Windows 95一样,十数年长期投入后,以小冰为代表的人工智能产品,会让微软重新找回其在操作系统的霸主地位。
如今,以AI和云为核心策略的微软,已经将语音识别误差率做到了5.1%,这意味着已经优于人类自身的5.2%。然而,这一数据是基于嘴对话筒的近距离测试环境。沈向洋认为,五年以内,不论用任何测试方式,机器对语音识别的误差率都会完胜人类。
比起操心识别率这种终将趋于完美的事情,近期,小冰团队思虑更多的是,在即将到来的九月份的小冰生日上,到底是宣布让她走进19岁,还是停留在18岁。
他们清楚地知道,现世的每一位,将是和人工智能共生存的第一代人类。在此之前,技术不过关;在此之后,除了与人工智能共存,人类没有别的选择。所以,到底什么年龄、什么形象、什么性格的聊天机器人,才会被人类友好接受,和谐自然地相处终身呢?
版权声明