时间:2017-06-02 来源:互联网 浏览量:
在不久前36氪联合主办的融合了音乐、科技与艺术的MTA天漠音乐节上,微软亚洲研究院的张霖涛提出,人工智能有三个重要的支柱点,分别是大数据、新算法和大系统。微软在大系统方面的努力是推出了开源的认知工具包Microsoft Cognitive Toolkit(之前叫做CNTK),现在这个工具包已经正式升版(2.0)并面向开发者开放。微软称在该系统帮助下,开发者可以在不具备深厚知识的情况下开放机器学习系统。
此次升级是在去年10月底推出的2.0 beta版基础上改进的。微软正是在该beta推出时将工具包的名字从Computational Network Toolkit(CNTK)更名为Cognitive Toolkit。同时引入了若干关键的功能特性,包括对Python的支持,增强的性能和学习能力等。
此次2.0版的升级主要提供了若干的新功能,包括对用于搭建神经网络的流行高层神经网络Python API Keras的支持(beta版)。鉴于此前另外两个流行的机器学习框架TensorFlow和Theano已经支持Keras,微软的此次更新意味着数据科学家可以轻易地在三种不同的后端之间移植代码。当然也会增加微软框架对开发者的吸引力。
此外,工具包还增加了对压缩模式的支持,在压缩模式下框架可以更容易地在低功耗的边缘设备进行部署,从而扩大机器学习的应用范围。微软还指出,Cognitive Toolkit将继续通过对新版NVIDIA深度学习SDK以及NVIDIA Volta等GPU架构的支持来加速训练能力。
在谈到Cognitive Toolkit的优势时,微软资深技术院士黄学东表示,微软的工具包跟其他工具包最大的不同在于数据。Cognitive Toolkit的数据姐帮你上都来自于微软自己的大规模生产数据。从Cortana到Bing乃至于Cognitive Services 中的Emotion API,这些都是用 Cognitive Toolkit创建出来的。
而香港浸会大学不久前进行的一次评测表明,在一系列利用GPU加速执行机器学习的框架当中,beta版的Congnitive Toolkit 2.0是速度最快的一个。
当然,不管是数据还是性能都不是决定框架流行度的唯一因素。在吸引数据科学家和开发者方面,Cognitive Toolkit目前仍面临着众多对手的激烈竞争。比如Google的TensorFlow目前是GitHub上最流行的开源机器学习框架。Amazon Web Services也推出了自己的深度学习框架Apache MXNet,Facebook则在努力推进自己的Caffe2框架。美国的四大巨头里面也许是苹果在机器学习的力度上稍弱一点。
所有这些工具都反映出一个更大的趋势,那就是为开发者提供利用机器学习的工具正在日益成为流行的改进应用的方式。从底层框架到预置的机器学习模型,微软等都在为开发者提供各种各样的工具,让他们在不需要培训的情况下就能在应用中植入AI能力。而这些巨头的好处是得以壮大自己的生态体系。