继星际争霸后,科学家成功用AI来玩愤怒的小鸟,但还是赢不过人类玩家

2019-10-13 09:29:21 来源:网络

愤怒的小鸟,几年前流行的移动游戏,现在受到人工智能的青睐。

本周在arxiv.org上发表的一篇预印论文中,布拉格查尔斯大学(CharlesUniversity)的研究人员详细介绍了使用深度q学习技术进行训练的人工智能系统dq-bird,该系统最初是由字母表的DeepMind提出的,并指示代理人在什么情况下采取行动。使用以往行动的随机样本。研究人员选择了深度Q学习式的双重学习,这不同于用于选择下一个行动的策略,并被用来评估第一个策略的决定。

参与该项目的研究人员说,愤怒的小鸟可以说是一项很难解决人工智能代理的任务,因为它有顺序的决策、不确定的游戏环境、巨大的状态和人物行为空间,以及区分不同鸟类的能力和最佳拍摄时间的需要。

为了在看似一无所知的水平空间中找到最佳解决方案,研究人员捕捉到了这个级别的截图,并对其进行了剪裁,同时隐藏了与游戏交互无关的UI等元素,对其进行调整和标准化,然后将其传递给深入q机器学习技术,以找出模型。

为了了解他们的模型,研究小组编辑了AnrayBirds经典的水煮鸡蛋收藏中的21个级别的数据集,其中包括115000多张截图,这些截图已经被剪裁和整理出来。接下来,他们将人工智能系统设置为10个级别的验证集。研究人员指出,他们的人工智能玩家可以在某些级别上获得超过四名职业球员的分数,但从21个级别得分的总和来看,他们的表现不如人类那么好。

研究人员指出,Depq并没有成功地让ai来扮演AnrangeBirds来赢得人类玩家的支持,但这已经是多年来解决AnrangeBirds问题的最佳尝试。

研究人员认为,目前人工智能在解决愤怒鸟类问题上的不足在于缺乏具有足够水平差异的训练数据集,但人工智能也常常通过第一次试图解决该水平,而且某些层次的弱点太明显,使得人工智能很难从错误的模式学习不同层次的解决方案,该模式已经完成,但对人工智能在解决问题方面的经验并没有提高多少。

这是一个有趣的观点,这可能是由于AnrangeBirds自己的水平设计逻辑不一致这一事实造成的。

上一篇:西行纪:“愤怒的小鸟”出现,白狼玩得不亦乐乎,唐三藏用心良苦
下一篇:最后一页