游戏开发的交互式工具

与之前的挑战相关,目前缺乏设计师轻松训练NPC行为的工具。虽然目前存在许多用于训练深层网络的开源工具,但大多数都需要大量的专业知识。一个工具可以让设计者容易地指定想要的NPC行为(和不想要的行为),同时保证对最终训练结果有一定程度的控制,这将大大加快游戏行业对这些新方法的使用。

从人类偏好中学习是这一领域的一个有希望的方向,在神经进化的背景下已经广泛研究了这种方法,允许非专家用户训练超级马里奥的行为。最近,类似的基于偏好的方法被应用于深度RL方法,允许代理人基于人类偏好学习和深度RL的结合来学习Atari游戏。最近,游戏公司King Published使用模仿学习来学习Candy Crush等级的游戏测试策略,为新的设计工具展示了一个有希望的方向。