> For the complete documentation index, see [llms.txt](https://hujian.gitbook.io/deep-reinforcement-learning/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://hujian.gitbook.io/deep-reinforcement-learning/fang-fa/kai-fang-de-tiao-zhan/jiao-hu-shi-you-xi-kai-fa.md).

# 游戏开发的交互式工具

与之前的挑战相关，目前缺乏设计师轻松训练NPC行为的工具。虽然目前存在许多用于训练深层网络的开源工具，但大多数都需要大量的专业知识。一个工具可以让设计者容易地指定想要的NPC行为(和不想要的行为)，同时保证对最终训练结果有一定程度的控制，这将大大加快游戏行业对这些新方法的使用。

从人类偏好中学习是这一领域的一个有希望的方向，在神经进化的背景下已经广泛研究了这种方法，允许非专家用户训练超级马里奥的行为。最近，类似的基于偏好的方法被应用于深度RL方法，允许代理人基于人类偏好学习和深度RL的结合来学习Atari游戏。最近，游戏公司King Published使用模仿学习来学习Candy Crush等级的游戏测试策略，为新的设计工具展示了一个有希望的方向。