强化学习:原理与Python实现

联合创作 · 2023-09-28 23:46

本书理论完备,涵盖主流经典强化学习算法和深度强化学习算法;实战性强,基于Python、Gym、TensorFlow 2、AlphaZero等构建,配套代码与综合案例。全书共12章,主要内容如下。

第1章:介绍强化学习的基础知识与强化学习环境库Gym的使用,并给出完整的编程实例。

第2~9章:介绍强化学习的理论知识。以Markov决策过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。

第10~12章:介绍了多个热门综合案例,包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。

肖智清

强化学习一线研发人员,清华大学工学博士,现就职于全球知名投资银行。擅长概率统计和机器学习,近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。

浏览 4
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报