时间:2017-07-14 来源:互联网 浏览量:
一个特别的应用
微软在 iOS 上推出了一款新应用《Seeing AI》,最近大家想必已经养成了但凡微软出一个新的移动端 App 就赶紧跟上去看看又是啥幺蛾子黑科技,《Seeing AI》确实是一款非常强的黑科技应用,虽然它暂时只有美国、加拿大、印度、香港等少数几个区上架,并且仅支持英文,但依旧挡不出未来一旦它能够获得到更广泛普及的时候,将成为造福很多人的手机 App。
《Seeing AI》是给视觉障碍者开发的,2016 年 3 月分,微软在 Build 大会上曾经展示过该应用的原型,当时就引发了不小的关注,现在《Seeing AI》正式登陆 iOS,而安卓版还要稍等一段时间。该应用简单滴说,就是通过人工智能神经网络技术,帮助视力缺陷者和盲人识别手机镜头面前出现的文本、人物、货币、扫描产品条形码、场景等等信息,并将这些信息转化为语音,利用人工智能为视觉障碍者打开新的视觉世界。
测试中的场景功能也很强大,它可以简单地用一句话概括镜头中拍下来的景物或者物品,比如“桌面上一台打开的笔记本电脑”之类。
微软预计还要给应用追加识别钱币的功能,此外,他们还准备让用户还可以用《Seeing AI》来识别邮件、照片、Twitter 等的图像,点击“共享”,然后选择“用 Seeing AI 识别”即可完成。
当然《Seeing AI》普通人也一样能够使用,而且就算是视力正常的人,也会赞叹人工智能在其中的表现和反应速度,如果能够借助投放手机端加快机器学习的深度和广度,那么我毫不介意常常用一下《Seeing AI》,让微软有机会把它做得更完善,方便更多视力有障碍的朋友们使用,这是一件非常有意义的事。
让科技当你的眼睛
Seeing AI 技术的背后是计算机视觉、图像识别、自然语言处理和机器学习等领域的持续了数十年的研究成果,微软的研究团队们在几年前想到了利用深层神经网络这种模仿人类大脑生物过程的系统来从事机器学习。随着系统获得与任务相关的训练数据越来越多,它们就变得越来越善于做某些事情——机器学习指的就是这个过程。例如,如果一名计算机科学家想设计一款帮助骑自行车的人识别后方车辆的应用,他就要向计算机提供无数张车辆的照片,以让这款应用学会识别一辆汽车与一个交通标志或一棵树之间的区别。计算机科学家以前也曾运用过神经网络,但却不是以这种方式,而如今新的方法让计算机视觉的精确度实现了巨大飞跃。
微软研究院的研究员们不仅在寻找识别图像的方法,为图像进行更贴近日常的语言描述。这项研究结合了图像识别技术与自然语言处理技术,能帮助视障人士获得对图像的准确描述,还可能帮助那些需要图像信息却无法直接看到图像的人——比如正在开车的司机。
Seeing AI 项目组中图像描述领域顶尖的研究者正在寻找办法,让计算机可以用更加人性化的方式来描述图像。例如,计算机可以将一个场景准确地描述为“一群人坐在一起”,但真人可能会将这一场景描述为“一群人坐在一起享受美好时光。”目前的挑战就是让这项技术懂得一张图像中哪些是对人们最重要、最值得描述的内容。
另外,微软的另一些研究员们正在努力让最新的图像识别工具提供更深入的图片解释。例如,与单纯地将图片描述为“一个男人和一个女人坐在一起”相比,对人们更有帮助的描述可能是:“奥巴马和希拉里·克林顿正在摆 pose 拍照”。团队中来自中国的研究员们正在开发一套借助机器学习识别名人、政治家和公众人物的系统,这套系统会根据图像本身的元素,而非与图像相关的文字内容来进行图像识别。
这一系列的研究成果,将成为微软认知服务中最新的视觉工具的一部分,未来可以用它来构建应用和服务,例如识别人脸、辨别情绪、分清不同的声音等,这些工具还为 how-old.net(微软颜龄机器人)和 Fetch(微软看图识狗)等有趣的微软人工智能应用提供了技术基础。
尖端科技转化价值
现在已经有一些能够帮助视障人士的手机应用和工具,但往往功能单一,而且并不是很好用;大多数视障人士更愿意尽可能独立地领略这个世界而不是选择请求他人帮助。
双目失明的 Anne Taylor 是微软的一名高级项目经理,她大约一年前来到微软,当时就对一群研究员和工程师的一个合作项目产生了兴趣。他们从事的项目旨在为视障人士开发一套辅助工具——这个项目就叫 Seeing AI,而 Taylor 喜欢亲切地称之为未来的“瑞士jun dao ”(“Swiss Army knife”)。双目失明的她加入微软正代表了盲人的需求,这是一次很好的经历。
Seeing AI 项目小组的成员包括来自世界各地的研究员和工程师。Seeing AI 吸引他们的除了其技术上的挑战外,还有他们期望帮助视障人士更加独立生活的美好目标。Seeing AI 项目担任领导角色的 Anirudh Koul 表示,他之所以对 Seeing AI 有着极大的兴趣,是因为他的祖父正在逐渐失明,“我们想要努力拿出一些人们切实需要的东西。”他说。
Seeing AI 技术可以用在手机端,也可以用于智能眼睛等一系列产品中,目前微软的人工智能产品就像一块块拼图一般被研发了出来,它们暂时还比较碎片化,但又同时基于一个人工智能网络之中,一旦拼图完成,我们有理由相信工程师和研究员们能够真的拼出一种能够改变人们生活的潜在服务。这就是科技的力量。