时间:2017-07-18 来源:互联网 浏览量:
Maluuba是一个由微软于1月收购的深度学习团队,他创建了一个人工智能系统,为吃豆人提供了完美的分数。
根据The Verge的报道,AI系统“学会了如何在Atari 2600上达到999,900的最大点值,使用一种独特的强化学习方法和一种分而治之的方法。”
“从报告:
虽然人工智能已经征服了大量的复古游戏,但由于游戏的缺乏可预测性,吃豆人多年来一直难以捉摸。
事实证明,这对人类来说也是一种坚强的意志。
很多人都试图达到吃豆人的最高得分,但在雅达利2600版本中只达到了266,330。
不过,这个游戏的999900个数字还不清楚,到目前为止,只有通过骗子才能实现。
Maluuba能够利用人工智能来解决这个问题,把责任分解成一份小的工作,分配给超过150名特工。
然后,团队用他们所谓的混合奖励体系结构来教授人工智能,这是一种强化学习和一种分而治之的方法的结合。
个别的特工被分配了一些零碎的任务——比如找到一个特定的小丸子——它与其他的药剂一起工作,以达到更大的目标。
然后,Maluuba指定了一名顶级经纪人(微软把这比作一家公司的高级经理),从所有的经纪人那里得到建议,以决定在哪里移动吃豆人。
最好的结果是当个体的经纪人“非常自我的”,而顶级的经纪人专注于对整个团队最有利的事情,他们不仅考虑了有多少经纪人想要进入一个特定的方向,而且还考虑了这个方向的重要性。