时间:2017-06-15 来源:互联网 浏览量:
既谷歌的阿尔法狗在围棋界打败人类,微软的AI也在Atari 2600版的经典游戏吃豆人中,获得最高分999,990分。
据了解,微软团队采用了一种“离散集合”式的技术,这种方法将游戏所需的策略和技巧分解成为独立的元素(以下简称H),H的不同部分专注于其中每个元素,而更高层次的H会做出总体决策,判断优先执行什么操作。
例如,某些H可能会追踪豆子,而另一些则专注于躲避敌人,负责最终决策的H将基于加权逻辑去进行决策。
如果50个H希望向左侧移动去吃掉一个豆子,1个想要向右移动躲避敌人,那么最终的决策将是向右移动,以避免撞上敌人,这样看来通过“运算”的方式好似让H实现了“思考”,最终达成一个最优化的结果,这和阿尔法狗从点到面的“全局观”如出一辙。
据悉,微软AI团队是2017年1月收购的加拿大深度学习创业公司Maluuba。
Maluuba利用了强化学习技术,即对于特定问题,AI将获得正面或负面反馈,从而应对不可预测性。强化学习被认为可以帮助系统自主做出决策,这与受监督学习不同,即系统依靠获得的正面和负面案例数据,从而建立经验基础。
微软曾一度将重心放在移动端、想在手机市场有所建树,甚至不惜因此和苹果交恶。
但纳德拉上台后的三年,一直在致力于扭转微软固有的骄傲心态,从想要打造“闭环”开始转向合作。
“的确我们在移动互联网时代落后了,但这都过去了,现在我们全力押注AI。”这是微软如今的策略,今年的微软Build大会上,纳德拉宣布,微软的战略从2014年提出的“移动为先,云为先”,转变为“智能云和智能边缘”。