时间:2017-06-15 来源:互联网 浏览量:
微软昨天宣布它的人工智慧(AI)系统在经典游戏《吃豆人》上拿下首个满分的999990分。
这个系统是由微软今年一月收购的加拿大深度学习新创公司Maluuba所开发。该团队运用一种强化式学习(reinforcement learning)的人工智慧技术及分散合击的策略,在Atari 2600模拟器上执行《吃豆人》,并因此超越人类拿下首个满分。
《吃豆人》是1980年代相当受欢迎的游戏,小精灵要在迷宫中尽可能吃下白豆子拿分,但又要小心4大幽灵的追赶。然而这个游戏变化多端相当难打,因而也成为许多AI界人士很有兴趣的目标。今年Google在4月1日也曾推出结合《吃豆人》和Google Maps作为愚人节庆祝活动。人类最高纪录是266,330分。
微软Maluuba团队设计了一种名为混合式奖赏架构的策略,它使用150多只小精灵,使它们在单一共同目标之下,又各自被分配一个特定任务。例如一些去寻找大力丸,一些负责躲避幽灵。此外并设计出一个类似公司资深经理的大精灵(top agent),可在收集所有精灵建议做出团队的最佳决策。
例如,某些AI可能会追踪豆子,而另一些则专注于躲避敌人。负责最终决策的AI将基于加权逻辑去进行决策。如果100个AI希望向左侧移动去吃掉一个豆子,而只有3个想要向右移动躲避敌人,那么最终的决策将是向右移动,以避免撞上敌人。
研究人员表示,透过强化式学习,这个AI系统中一方面协调所有成员偏好,另一方面让各个成员专注单一问题,结果是对整个团体都获益。
这次发表再次显示AI在游戏或比赛上已经不输人类。Alphabet旗下DeepMind公司的人工智慧AlphaGo在上个月以三战全胜击败世界排名第一的柯洁后,暂时没有人类能阻止AI了。