> For the complete documentation index, see [llms.txt](https://hujian.gitbook.io/deep-reinforcement-learning/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://hujian.gitbook.io/deep-reinforcement-learning/fu-lu/policy-gradient.md).

# Policy Gradient

- [Off-Policy Actor-Critic](https://hujian.gitbook.io/deep-reinforcement-learning/fu-lu/policy-gradient/off-policy-actor-critic.md)
- [Generalized Advantage Estimation](https://hujian.gitbook.io/deep-reinforcement-learning/fu-lu/policy-gradient/advantage-estimation.md)
- [Soft Actor-Critic](https://hujian.gitbook.io/deep-reinforcement-learning/fu-lu/policy-gradient/soft-actor-critic.md)
- [PPO-Penalty](https://hujian.gitbook.io/deep-reinforcement-learning/fu-lu/policy-gradient/ppo-penalty.md)