时间:2017-08-22 来源:互联网 浏览量:
李根 发自 微软亚洲研究院
量子位 报道 | 公众号 QbitAI
微软开了一场马拉松式的发布会,正式推出第五代小冰,8位嘉宾轮流上台,进展一个接一个。
这可能要让不少人开心,比如之前在乌镇与围棋AI AlphaGo相杀的围棋国手柯洁九段,这个20岁少年最近在央视节目《机智过人》上,甚至还自曝是微软小冰的粉丝。
所以随着这一代小冰的发布,柯洁可能要接到来自“偶像”的电话了。
在2017年8月22日正式推出的第五代微软小冰中,将上线高级感官功能、新增使用生成模型(Generative Model)、进军IoT展开合作、创作诗歌后试水有声读物,并且大Bing小冰进一步整合,推动智能媒体领域的变革。
主动打电话只是其中值得一提的一项。那第五代小冰具体都包含哪些呢?量子位为你一一分解。
第五代小冰首先,第五代微软小冰与前几代有何不同?最核心的能力是高级感官功能的赋予,将在人机交互中占据主动地位。
“微软小冰之父”李笛说,第一代、第二代要做到有趣,能够让人有的聊;第三代小冰要有情趣,可以让人聊下去;第四代小冰则能探测,知道用户的偏好和兴趣;到了第五代,小冰甚至可以主动发起聊天。
这种主动如何实现?更高级的感官。
其实在第三代小冰中,就已经不断有了感官的引用。只是第三代小冰,引入的是初级感官,通过核心对话引擎的使用,可以混用不同的感官,比如自如切换图像、语音和文本等。第四代小冰则迭代至“全时感官”,与人类的无缝流畅对话,甚至根据聊天内容与走向相互打断与追问,甚至能够让AI与人类打电话。
到了当前第五代微软小冰,更高级的感官则让“全时感官”里的“打电话”变得“对讲”而已。第五代小冰能够主动发起通话,能够感知人类情绪和周边环境,做出相应交流的话题和语气。
更形象的比喻如李笛玩笑所言,第五代小冰开始,假如再有人在微博、微信上骂小冰,小冰完全可以半夜12点电话“报复”了。
新增使用生成模型(Generative Model)当然,第五代小冰在技术上更一颗赛艇的突破来自生成模型(Generative Model)的运用。这是全球当前开放领域人工智能对话中,首个完全使用生成模型(Generative Model)的落地产品。
这又意味着什么呢?意味着第五代小冰开始,将有全新的“对话语言”被创造,而且还是人工智能的原创。
在之前未使用生成模型的小冰版本中,回复的每一句话,其实都是互联网上的数据,都依托于微软的大数据语料库。小冰的方法是理解问题,然后找到合适的话来回答,但从今使用生成模型后,“鹦鹉学舌”的情况将被终结,小冰未来与人类交流的每一句话,可能之前并未在这个星球上出现过。
AI原创内容再进阶实际上,生产模型在之前已经有所运用。更早之前,小冰已经出版了自己的原创诗集,这是人工智能在原创内容方面的重要一步。
但随着高级感官、生成模型等技术的使用,第五代小冰还被“获准”进入更多的领域,其中发布会上大书特书的就是“有声读物”领域。
这也将造成一部分以此为职业的人类的“转型”。
以《格林童话》为例,如果人类选手生成一版50小时长的《格林童话》有声读物,需要耗时至少200小时,金钱成本62100元,但如果让小冰来做,可能只需要24分钟,花费7毛钱。
这将是一个行业地震式的变革。但微软小冰团队也强调,小冰更多是“协作者”的姿态出现,而不是“替代者”,不会完全替代人类在这方面的职业机会,但能够协助生产更多优质的有声读物内容,为人类服务。
在发布会现场,小冰能够为每一段将要朗读的文字配备她认为合适的背景音乐,而且(SR和TTS)等表现上,已经不太听得出来自一位机器人选手。
这也让小冰进一步发布歌曲成为可能。虽然之前已经有过歌曲发布,但第五代小冰展现出的“歌喉”,已经没有“机械感”了,不信可以通过QQ小冰“索要”一首《我是小冰》听一听。
除了写文作曲,目前小冰还有“作画”能力,她可以结合不同城市标志性建筑的学习,创造该城市相关的视觉作品。
这也未微软小冰变现增加了新的可能。微软与SELECTED合作,推出了一款“天际线”服装,并且定价299,不仅让人类穿上AI设计的衣服,还要以此赚人类的钱了。
全面进军IoT领域 小冰电台上线目前智能音箱的“百箱大战”已然打响,但微软小冰在这方面始终按兵不动。这看起来似乎有什么隐而不宣的原因。
此次发布会上,微软小冰团队道破答案。之所以不推出小冰智能音箱,是因为对IoT的态度上,微软有自己的逻辑和看法。
微软认为,IoT应该只是AI的载体之一,而不应该让AI成为IoT的功能。所以微软认可的AI赋能IoT的方案是,要么把IQ做到极致,可以让物联网设备更加便捷高效,要么把EQ打造完备,人们可以把这个装在硬件设备里的AI当做情感纽带、家庭成员。当然,按照小冰一开始的定位,微软的目标是后者。
于是现在,小冰借助小米IoT平台米家,开始“入驻”家庭,除了通过小冰操控家中的智能设备,还能有一种“打电话”的感觉,而且小冰还会兼具身份识别,家庭成员中的“爸爸”、“儿女”、“父母”等都会有不同话语的交流。
此外,除了小米IoT平台米家,微软小冰还将与小米生态链企业Yeelight推出智能灯产品,与互娱领域的东方明珠推出一款暂未透露的“神秘”产品——更早之前,微软小冰还出席了广州东方数智科技有限公司的成立,这是一家与东方明珠达成“IP+AI”战略合作的新公司。
另一个落地的说新不新的产品是“小冰电台”,小程序版本。
小冰电台可以基于多重来源,面向各种主题,自主创造节目:讲段子、播放歌曲、互动交流,都可以是这个电台的主题,其实与人类电台已经没有实质区别,只是小冰不用休息也不用发薪水而已。
量子位抢先试听了“小冰电台”,当我告诉小冰“我要当爸爸了,来电音乐吧”的时候,她给我来了一首“千千阙歌”,并深情款款地说“这是我妈妈最爱听的歌曲。”
整体来讲,小冰电台的体验还是非常不错的,如果有缺点,可能是“歌曲版权”方面,她现在的曲库资源完全来自“咪咕”。
媒体变革 搜索进化 反击Google最后,作为EQ方面最具代表性的AI产品,小冰在升级至第五代之际,实际也已经在前几代“领养”过程中获得了更多大数据收集、分析和处理的经验,而且原创能力的实现,也为小冰在新闻媒体领域大展身手提供了前提。
更早之前,小冰已经为《钱江晚报》撰写了不少新闻,而且源于机器在“知识图谱”方面的能力,可以对于某个新闻事件的前因后果、左右关联更为熟稔,于是可以预测重要事件的结果。
可能同样处于“尊重人类”的考虑,小冰团队在这方面还是用了“协作”,而不是“替代”记者。
但毫无疑问的是,那些“跑得快”的快讯、消息类记者,将实实在在被机器替代。而更多深度内容、非虚构创创作等方面的记者,则确实可以让小冰帮助完成“功课”环节,她能够从海量网络世界中收集整理相关资料,帮助人类记者更快完成对某个事件的认知。
小冰在媒体领域的“大展身手”还包括在交互上,一个更加精准的“搜索机器人”将进入媒体App、微信和微博等平台中。
当然,类似的方式也将被微软复制到搜索领域。小冰(小Bing)将和大Bing加快融合,为每一个新闻数据构建“知识图谱”,帮助用户更快速全面搜索想要找到的内容。“推送”为王的AI新媒体变革也可能就此被打破,主动交互式的信息交换可能又要回潮——但已经是完全不同的主动阅读体验了。
现在,Bing在美国拥有33%的市场份额,在中国,英文搜索流量占比22%,微软希望借助大Bing小冰融合,以搜索体验提升为吸引力,向老对手Google发起新一轮挑战。
微软全球执行副总裁、微软AI研究事业部负责人沈向洋说:依靠AI,构建知识图谱,未来在很多市场,可以跟Google一争高下!