时间:2018-05-31 来源:互联网 浏览量:
1995年,微软公司创始人比尔·盖茨亲笔撰写的《未来之路》一书成为畅销书,并被评为“新中国成立50年最有影响的100部图书”之一。这本书中满是比尔·盖茨对未来的预言。时至今日,包括智能手机、视频会议、在线音乐等在内的多个预测都已经成为现实。
今天,人工智能技术扑面而来,微软推出的《未来计算:人工智能及社会角色》一书则从人工智能的未来,负责任地使用人工智能的原则、政策和法律,以及人工智能与职业和工作的未来等三个方面进行深入剖析,并创造性地提出了人工智能开发的六大原则:公平、可靠和安全、隐私和保障、包容、透明、责任。
相比较比尔·盖茨天马行空又不失真实的预言,由微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋与微软总裁及首席法务官施博德共同撰写的这本书更像是一本人类迈向人工智能时代的教科书,教给我们如何更好地运用这一新技术。在笔者看来,这本书充分体现了微软作为人工智能领域领导者,对于人工智能技术发展,以及如何让人工智能等新技术为社会创造更多福祉等问题的深刻思考。
众所周知,一家企业只有真正成为行业领导者,才能掌控行业话语权。在人工智能领域,微软作为话语权的拥有者,如何做好这个领域的引领者?在日前首次在中国召开的2018微软人工智能大会上,微软不仅将自身在人工智能领域的能力进行了全方位展示,还在大秀肌肉的同时,充分展现出一家领导企业应有的格局。
沈向洋 微软全球执行副总裁、微软人工智能及微软研究事业部负责人
从Azure到AI平台技术与服务才是核心发力点
作为微软人工智能领域的大咖,沈向洋、郭昱廷、黄学东等在微软工作已经超过二十年,在过去二十年间,他们在微软所从事的工作多多少少都与人工智能相关,这也是今天微软能够牢牢抓住人工智能话语权的根本。很多时候,人们都只看到了微软在AI领域的成绩,却未曾看到在这些成绩背后持续多年的巨额投入。
如今,AI再次成为业界关注的焦点领域,第一次显现出彻底改变世界的潜质,这一天,微软云计算与人工智能事业部全球资深副总裁郭昱廷已经等了20多年,在他的记忆里,上世纪80年代是AI的上一个春天,可直到上世纪90年代初,AI领域还没有出来像样的成果,行业的冬天随之降临,直至今日。
郭昱廷认为,今天的人工智能能够再次呈现爆发式增长,得益于三大要素的出现:首先,大数据时代的到来;其次,云计算的兴起;第三,算法的发展。大数据和计算能力的叠加,再加上强大算法的配合,AI迎来了真正的春天。
微软近几年的发展恰恰印证了这一说法,自微软全面发力云计算领域至今,微软智能云Azure已覆盖全球50多个区域,并且获得了不同地区的超过70项安全合规认证,逐渐成为“世界的计算机”。不仅如此,Azure在发展过程中也在不断汇集微软在人工智能领域多年的技术积累,并发展成为开发、部署、运行人工智能的最佳云平台。
这恰恰是微软给自己在云计算与AI领域的定位:专注于打造平台技术与服务。事实上,早在上世纪90年代微软成立研究院时,就确定了多个围绕AI展开的研究项目,包括计算机视觉、语音识别、自然语言识别等。
黄学东 微软全球资深技术院士,微软云与人工智能事业部
微软云与人工智能事业部全球资深技术院士和首席语音科学家黄学东作为相关领域带头人,一直推动语音识别、自然语言处理等技术的创新与发展,并取得了一系列进展:2016年,微软率先实现语音识别系统5.9%的低错误率;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,这一水平足以媲美人类专业速记员;
2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平……
执着于技术研发和创新的微软并没有将成果视若珍宝,轻易不主动示人,反而不断推动这些平台技术的开放。早在两年前的Build 2016微软全球开发者大会上,微软就首次公布了运行于Azure的认知服务,以API的形式为开发者提供触手可及的人工智能。微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务,目前已经有超过100万开发者使用认知服务。
这也恰恰印证了微软给自己赋予的使命:予力全球每一人、每一组织,成就不凡。
开放合作共享 AI生态赋能者将是主要角色
在此次微软人工智能大会上,来自南京工业大学的硕士研究生宋昊旻与沈向洋在现场借助人工智能技术上演了一次震撼却又充满温情的对话。原本因为小时候用药不慎造成神经性听力损失的宋昊旻,虽然能够像常人一样发出声音,但他的语音、语调则会显得有些吃力和不自然。
这种情况对于和普通人沟通或许并非难事,但对人工智能却是一个大挑战。为此,基于Microsoft Translator打造的微软语音服务,专门针对宋昊旻的声音特点定制了语音识别模型,能够以极高的准确度将他的语音实时转换成文字,还能同步翻译成英语或其它语言,从而真正实现了宋昊旻与沈向洋的无障碍沟通。
同样是基于Microsoft Translator,小米生态链企业香蕉出行推出了魔芋AI翻译机,一时间成为出境游游客争相购买的爆款。据香蕉出行合伙人及CTO于亮介绍,魔芋AI翻译机能够提供多达14种语言的实时语音翻译,让多个不同语言的人可以借助这一设备实现自由交流。
如果说魔芋AI翻译机是一款针对普通消费者的产品,那么微软全球首创的AI会议系统则称得上是一款“办公神器”。在黄学东的现场演示和介绍中,这款“神器”可以用人工智能同时记录多人会议的语音和图像、对不同人的发言进行标记和语音转写、分开归档并提取会议重点议题或摘要。
对此,黄学东表示:“谷歌前不久推出的全双工语音通话,无非能让两个人自由的讲话。而我们这个系统不仅能支持两个人讲话,还能支持三个人、四个人、五个人讲话,真正做到了‘眼观六路耳听八方’,我更愿意称它是‘全武功’。”
不仅如此,这款神器还拥有微软所开发的麦克风阵列开发系统,能大幅提高远场语音识别的能力;再加上360度的摄像头和Microsoft Translator,堪称是微软各种黑科技的集大成者。
不过,这款产品并非完全由微软打造,而是微软与Roobo联合研发的产物。据Roobo合伙人兼CTO雷宇介绍,基于微软语音团队联合Roobo共同研发的多MIC语音开发板MSDDK(Microsoft Speech Device SDK),ROOBO完成MSDDK在音频,声学及硬件的设计与实现,并且由ROOBO直接向开发者提供硬件,而微软则提供Speech Service开发平台。
从表面上看,这是一个AI会议系统,但这些技术的组合完全可以应用于更多的工作和生活场景。正如雷宇所说,它不仅提供了极致的体验,更重要的是重新定义了交互,相当于推动人工智能进入“智能机”时代。
百芝龙作为一家专注于研发基于家庭场景下可预测用户行为和需求的人工智能服务系统的企业,他与微软的合作模式与香蕉出行、Roobo等企业颇为相似:微软提供底层技术,扮演平台技术和服务提供商,他们则在这些底层技术的基础上开展人工智能的应用创新。
正如百芝龙CEO叶伟所说,作为一家应用层的企业,公司不可能再花二三十年重新研发AI底层的技术,与微软的合作恰好可以发挥各自的优势。首先,微软在AI领域已经有二三十年的积累;其次,微软只做裁判员不做运动员,不会与合作伙伴争利。在这种情况下,百芝龙只需要做好自己在应用层该做的事情即可,即便在技术上碰到一些问题,还可以通过与微软的合作,共同解决。
从上述这些案例可以看出,面对不同的合作伙伴,微软所扮演的角色都是类似的:在AI这样一个大的生态系统中,微软要做的事情其实就是把底层的技术和平台做好,并将其开放出来,为不同的合作伙伴赋能,从而激发AI的活力,切实推动人工智能的普及应用。这与微软公司的使命可谓一脉相承。
从操作系统生态到AI生态 巨头的华丽转身
两个月前,微软对自身的组织架构做出了全新调整,成立了“体验和设备”部门(Experiences & Devices org)和“云与人工智能”平台(Cloud + AI Platform),而Windows和设备部门(Windows and Devices Group)则被拆解。
原本隶属于人工智能与研究事业部的郭昱廷在这次调整中也转到了新的云计算与人工智能事业部,“这样的变化也体现出微软在人工智能领域的决心。”郭昱廷强调。
在笔者看来,这既是微软对过去的告别,也是微软对未来的拥抱。其中,告别指的是向传统的操作系统生态告别;而未来则是对新的人工智能生态的拥抱。不可否认,在PC时代,微软构建的以Windows为核心的生态系统造就了今天的微软;但在新的人工智能时代,Windows已经完成了它的历史使命,微软需要走向下一站——人工智能。
有趣的是,如今微软要打造的人工智能生态与曾经的操作系统生态有着明显的区别:操作系统生态时代,微软是一家独大,而且操作系统的开放程度也没那么强;但在人工智能生态时代,微软则专注于底层技术研发,将应用完全交由合作伙伴完成,这无疑将进一步推动人工智能生态的繁荣。
在这一过程中,微软不仅是赋能者,也是被赋能的一方;微软为合作伙伴提供底层技术和平台,合作伙伴在基于它们开展应用创新时,又会反过来促进微软对底层技术和平台进行持续优化。如今,这样一个良性循环正在形成,受益的不仅是微软和它的合作伙伴,更是整个人工智能领域。