时间:2017-08-25 来源:互联网 浏览量:
8 月 23 日下午,在微软第五代小冰的发布会上,有一个这样的桥段:小冰通过电信网络直接拨通了现场一位媒体观众的手机,在和他说了生日快乐,唱了几句生日歌,又寒暄了几句之后,用“你还在开会很忙吧”,结束了对话。
这种让人工智能像人类一样说话的技术,微软亚洲研究院叫它“全双工语音”,意思是 AI 不再只能在聊天软件里你来我往的交流,现在可以像真人一样,实时的在你说话之后给你一个回复。微软说,小冰的模式不仅是回应你说的话,在你沉默不说话的时候,她也知道要说什么来让话题继续下去。
微软亚洲研究院历来重视小冰发布会,这个研究项目三年半前立项,在发布之初,她被设定成一个 15 岁的少女,可以通过文字的方式和人聊天。如果从一个普通用户的角度来看,几年过去,小冰慢慢可以看懂图片,听懂你发的语音,回复语音,看懂更多的图片和视频,给你唱歌……现在终于可以和人直接聊天。
第五代发布会,小冰展示的最大亮点,是她的“创造”能力。
小冰以后可以直接拨电话给你
从小冰这段示例语音来看,她每个字直接的连读更像人,句、逗之间的语气听起来有上下文承接,和百度、科大讯飞、苹果的其他语音助手最大的区别是,它能够结合上下文把多音字读出正确的读音。
在一段“龟兔赛跑”的童话朗读语音实例中,只有小冰能没有人工干预的情况下准确识别“生长”和“伸长”中多音字的正确读法,可以认为是小冰具有对中文上下文理解的能力。过去在小冰参加的电视综艺节目里,也可以看到她对自然语言的实时反应。
总得来说,可以认为小冰现在学会了说话。
微软在发布会上宣布,从 9 月开始,小冰开始启用全新的“生成模型”来生成对话。过去,基于大数据和深度学习的模式,实际上全世界“聊天机器人”这个类型的人工智能,他说的每一句话应该都是有另外的用户曾经说过的。微软把这种模式叫“检索模型”。
但“生成模型”不一样。在这个模式下,小冰说的每一句话都有可能是完全生成的。目前,微软小冰和她的不同语言版本在中国大陆、日本、美国和印度已经上线,这个月也开始在印度尼西亚提供服务。微软说,中国、日本、美国和印度的小冰采用了混合模式,也就是大部分回应是检索出来的,小部分是全新生成的,但在印尼投入的新版本完全使用“生成模型”运转,每一句话都是新的。
小冰实时对话之前就出现过。去年,微软已经在发布会上展示了打电话的功能,但这次发布会宣布的是这项功能大规模测试的开始,以后所有普通用户都可以在周三例行更新日的时候跟小冰预约,小冰可以直接把电话打到你的手机上,移动、电信和联通都可以。
关于打电话这个能力,微软还描述了一个令人细思恐极的场景:未来用户在微博上如果对小冰出言不逊,她可能可以直接打电话给你聊一聊。
微软说,小冰以后要从事内容创作
微软在发布会上展示的读童话故事,不仅仅是语音生成能力的展示,似乎也预示着未来小冰的商业模式。
过去几个月,微软已经用小冰来生成童话朗读节目匿名发在蜻蜓 FM 和喜马拉雅电台上累计播放数量约为 30 万,而且从评论里来看,似乎很多听众没有分辨出这个朗读是人工智能生成的。微软说,一本 210 集的《格林童话》有声读物内容大概是 50 小时,人类配音演员需要 200 小时工作时间,成本大约 6 万元。相比之下,小冰只需要 24 分钟,抛开研发之外,运行成本可以忽略不计。
和印花 T 恤衫这种看起来更像是营销的项目相比,有声读物确实更像是一个可行的商业模式。在音乐和电台类应用里,有很多虚构类文艺作品的听书节目,基于听书这种形式,这些节目大部分都是用来休闲和打发时间,人工智能也许可以胜任这种“敷衍”的娱乐。
“现在的智能音箱还不算是人工智能”,微软也不做智能音箱
发布会主持人之一、小冰产品总监彭爽说,语音本身不是智能音箱产品的核心。更不应该逼迫用户去和它说话。
微软将和第三方合作,来研发内置小冰的硬件产品。目前宣布的有小米生态链企业 Yeelight,这家厂商之前做过智能台灯;合作方还有东方明珠,微软说会做一款儿童取向的智能产品,几个月内上市。
目前,小冰 FM 以微信小程序的方式上线。在实际体验里,小冰 FM 确实可以基于合作的咪咕音乐的版权内容不断播放新的节目,比如热门音乐排行榜之类。点击“录音”按钮可以语音互动,告诉她“下一首”,她可以回应“你不喜欢这一首吗?”然后切换新的歌曲。
但小冰 FM 似乎没有视频里展示的那么智能,比如说“我喜欢 XXX 歌手”,得到的回应更可能是“我也喜欢”,而不是换成这位歌手的歌曲。简单的说,小冰 FM 现在还更像那个随便聊天的小冰,而不是一个音乐主播。
还有一个问题来自小冰签约的版权曲库咪咕音乐:如果你恰好问道咪咕音乐没有版权的歌曲,小冰就会开始比较生硬的岔开话题,不幸的是,咪咕音乐缺的歌挺多。
微软想让小冰接触更多人,可似乎用力的方向不大对
微软在推广小冰这件事上做了不少事情,但看起来效果一般。
小冰在东方台《看东方》节目播了很长一段时间的天气预报和客串主持,但视觉形象只有一行字和一个麦克风图标;在北京青年广播和湖南电台音乐之声做过客串主持,但听收音机本来就是一件不再流行的事,更何况是要宣传一个看不到形象的声音。
最近在湖南卫视播出的《我是未来》看上去是小冰形象最突出的一次,节目给她设计了一个虚拟形象,节目的内容也和人工智能关系密切。
相比之下,百度做的人工智能在电视节目《最强大脑》里的表现就要突出很多,不仅给这个人工智能设计了一个实体机器人,还在比赛环节里给它拼命加戏:比如选手和人工智能比赛人脸识别的环节,百度这个机器人也假模假式地看着照片,实际上稍有了解的人就知道,这些数据是直接喂给人工智能的,根本没有所谓“看”的环节。
微软在发布会上说,接下来小冰会参与 CCTV 一档《机智过人》的综艺节目,估计以后 CCTV 的宣传效果会相对好一些。
从微软内部产品来看,它们会把 AI 慢慢加进产品序列。现在 Office 套件中已经集成了很多人工智能的组件,比如对幻灯片实时文字解说和实时翻译的工具,Skype 里面也有人工智能翻译工具等等。
微软执行副总裁沈向洋说,微软的人工智能主要两个路线,一个是围绕现有产品的人工智能化,比如 Windows 和 Office,一个是围绕政府、医疗、交通行业的行业应用,另外还有人工智能伦理方面的前瞻研究。
喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。