时间:2017-06-18 来源:互联网 浏览量:
Maluuba的方法很有趣。这种方法将游戏所需的策略和技巧分解成为独立的元素,AI的不同部分专注于其中每个元素,而更高层次的AI会做出总体决策,判断优先执行什么操作。
微软在官方博客中表示,《吃豆人》游戏在AI研究领域被广泛使用,因为其玩法存在不可预测性。这款游戏最初的开发者之一的格尔森(Steve Golson)指出,这是有意为之,因为游戏依赖于玩家通过反复练习去获得成功。
Maluuba利用了强化学习技术,即对于特定问题,AI将获得正面或负面反馈,从而应对不可预测性。强化学习被认为可以帮助系统自主做出决策。这与受监督学习不同,即系统获得正面和负面案例数据,从而建立经验基础。