deep-reinforcement-learning
Ctrlk
  • 介绍
  • 前言
    • 神经网络
    • 研究平台
  • 方法
    • 街机游戏
    • 蒙特祖玛的复仇
    • 竞速游戏
    • 第一人称射击游戏
    • 开放世界游戏
    • 即时战略游戏
    • 团队体育游戏
    • 文字冒险游戏
    • 开放的挑战
      • 游戏通用性
      • 稀疏、延迟、欺骗性的回报
      • 多智能体
      • 终身适应
      • 像人类一样玩游戏
      • 可调节的性能等级
      • 处理巨大的状态空间
      • 工业界应用
      • 游戏开发的交互式工具
      • 创造新的游戏
      • 学习游戏的模型
      • 计算资源
  • 附录
    • Distributional RL
    • Policy Gradient
    • Model-Based RL
    • Imitation Learning and Inverse Reinforcement Learning
    • Transfer and Multitask RL
Powered by GitBook
On this page

Was this helpful?

  1. 方法

开放的挑战

游戏通用性稀疏、延迟、欺骗性的回报多智能体终身适应像人类一样玩游戏可调节的性能等级处理巨大的状态空间工业界应用游戏开发的交互式工具创造新的游戏学习游戏的模型计算资源
PreviousAE-DQNNext游戏通用性

Last updated 6 years ago

Was this helpful?