学习游戏的模型

在游戏深度学习方面的大量工作采用了无模型的端到端学习方法,其中训练神经网络以产生以状态观察为输入的动作。然而,众所周知,良好且快速的模型使游戏更容易,因为它可以使用基于树搜索演化的规划方法,因此,这个领域的一个重要的开放挑战是开发可以学习游戏正向模型的方法,从而可以推断出它的动态。希望是学习游戏规则的方法可以更好地概括为不同的游戏变化和更强大的学习。该领域的有前景的工作包括Guzdial等人的方法学习超级马里奥兄弟的简单游戏引擎。Kansky etal]引入了Schema Networks的思想,该思想遵循面向对象的方法,并且经过训练,可以根据当前的属性和行为来预测味蕾对象属性和奖励。因此,训练有素的模式网络提供了一个可用于规划的概率模型,并且能够执行零射击转移到训练中使用的突破类似的变化。