deep-reinforcement-learning
search
Ctrlk
  • 介绍
  • 前言
    • 神经网络
    • 研究平台chevron-right
  • 方法
    • 街机游戏chevron-right
    • 蒙特祖玛的复仇chevron-right
    • 竞速游戏chevron-right
    • 第一人称射击游戏chevron-right
    • 开放世界游戏chevron-right
    • 即时战略游戏chevron-right
    • 团队体育游戏chevron-right
    • 文字冒险游戏chevron-right
    • 开放的挑战chevron-right
      • 游戏通用性
      • 稀疏、延迟、欺骗性的回报
      • 多智能体
      • 终身适应
      • 像人类一样玩游戏
      • 可调节的性能等级
      • 处理巨大的状态空间
      • 工业界应用
      • 游戏开发的交互式工具
      • 创造新的游戏
      • 学习游戏的模型
      • 计算资源
  • 附录
    • Distributional RLchevron-right
    • Policy Gradientchevron-right
    • Model-Based RLchevron-right
    • Imitation Learning and Inverse Reinforcement Learningchevron-right
    • Transfer and Multitask RLchevron-right
gitbookPowered by GitBook
block-quoteOn this pagechevron-down
  1. 方法

开放的挑战

游戏通用性chevron-right稀疏、延迟、欺骗性的回报chevron-right多智能体chevron-right终身适应chevron-right像人类一样玩游戏chevron-right可调节的性能等级chevron-right处理巨大的状态空间chevron-right工业界应用chevron-right游戏开发的交互式工具chevron-right创造新的游戏chevron-right学习游戏的模型chevron-right计算资源chevron-right
PreviousAE-DQNchevron-leftNext游戏通用性chevron-right

Last updated 6 years ago