关于我们
![]() ![]() |
强化学习 读者对象:机器学习研究人员
本书的主要内容有:学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。
你还可能感兴趣
我要评论
|