中图网

>

软件工程/开发项目管理

基于Python的强化学习

作者：(美)安德里亚·隆萨

出版社：中国电力出版社出版时间：2023-01-01

开本： 16开 页数： 284

本类榜单：计算机/网络销量榜

中图价:¥52.8(6.0折) 定价 ~~¥88.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满69元免运费

?快递不能达地区使用邮政小包，运费14元起

云南、广西、海南、新疆、青海、西藏六省，部分地区快递不可达

本类五星书更多>

>
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用

¥11.3¥45
>
决战行测5000题(言语理解与表达)

决战行测5000题(言语理解与表达)

¥28.2¥88
>
软件性能测试.分析与调优实践之路

软件性能测试.分析与调优实践之路

¥55.2¥69
>
第一行代码Android

第一行代码Android

¥76.2¥99
>
C Primer Plus 第6版中文版

C Primer Plus 第6版中文版

¥75.6¥108
>
深度学习

深度学习

¥82.3¥168
>
MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

MATLAB计算机视觉与深度学习实战-赠在线交流卡和本书源码

¥43.5¥79

商品详情
商品评论(0条)

中图价:¥52.8 加入购物车

版权信息
本书特色
内容简介
目录
作者简介

微信公众号

基于Python的强化学习版权信息

ISBN：9787519870379
条形码：9787519870379 ; 978-7-5198-7037-9
装帧：一般胶版纸
册数：暂无
重量：暂无
所属分类：
计算机/网络
>
软件工程/开发项目管理

基于Python的强化学习本书特色

本书将帮助读者掌握强化学习算法，并通过构建自学习智能体，理解算法的实现。

基于Python的强化学习内容简介

本书首先介绍在强化学习环境中工作所需的工具、库和设置，涵盖了强化学习的构成模块，深入探讨基于值的方法，如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外，在学习DDPG和TD3确定性算法之前，读者将学习策略梯度方法，如TRPO和PPO，以提高性能和稳定性。本书还介绍模仿学习的原理，以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。*后，读者将掌握探索方法，如UCB和UCB1，并开发一个名为ESBAS的元算法。
如果你是人工智能研究者、深度学习用户，或者希望从头开始学习强化学习的人，那么这本书就很适合你。如果你想了解该领域的进展,也会发现这本书很有帮助。当然，Python的基础知识是必需的。

基于Python的强化学习目录

前言

**部分算法与环境
第1章强化学习概貌
1．1 强化学习导论
1．1．1 比较强化学习和监督学习
1．1．2 强化学习的历史
1．1．3 深度强化学习
1．2 强化学习的要素
1．2．1 策略
1．2．2 值函数
1．2．3 回报（奖励）
1．2．4 模型
1．3 强化学习的应用
1．3．1 游戏
1．3．2 机器人与工业4．0
1．3．3 机器学习
1．3．4 经济学与金融
1．3．5 医疗健康
1．3．6 智能交通系统
1．3．7 能源优化与智能电网
1．4 本章小结
1．5 思考题
1．6 延伸阅读
第2章强化学习过程与OpenAIGym
2．1 环境设置
2．1．1 安装OpenAIGym
2．1．2 安装Roboschool
2．2 OpenAIGym和强化学习过程
2．2．1 开发强化学习过程
2．2．2 了解空间概念
2．3 利用TesorFlow开发强化学习模型
2．3．1 张量
2．3．2 创建计算图
2．3．3 线性回归示例
2．4 TensorBoard介绍
2．5 强化学习环境
2．5．1 为什么需要不同的环境
2．5．2 开源环境
2．6 本章小结
2．7 思考题
2．8 延伸阅读
第3章基于动态规划的问题求解
……

第二部分无模型强化学习算法
第三部分超越无模型算法

附录思考题参考答案

展开全部

基于Python的强化学习作者简介

[美]安德里亚·隆萨(Andrea Lonza)是一名深度学习工程师，对人工智能怀有极大的热情，渴望创造出具有智能行为的机器。他通过理论性的和工业应用性的机器学习项目获得了强化学习、自然语言处理和计算机视觉方面的专业知识。他还参加过几次Kaggle比赛，并取得了很好的成绩。他总是在寻找引人入胜的挑战，并喜欢证明自己。

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
龙榆生：词曲概论/大家小书
龙榆生：词曲概论/大家小书
龙榆生
¥9.1~~¥24.0~~
>
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
[美] 诺尔曼·伯德韦尔著，杜可名译
¥3.3~~¥10.0~~
>
伊索寓言-世界文学名著典藏-全译本
伊索寓言-世界文学名著典藏-全译本
[古希腊] 伊索著，陈韵如译
¥6.1~~¥19.0~~
>
姑妈的宝刀
姑妈的宝刀
莫言
¥11.4~~¥30.0~~
>
朝闻道
朝闻道
刘慈欣
¥10.2~~¥23.8~~
>
巴金－再思录
巴金－再思录
巴金
¥33.1~~¥46.0~~
>
唐代进士录
唐代进士录
陶易
¥19.1~~¥39.8~~
>
中国历史的瞬间
中国历史的瞬间
李永炽
¥19.0~~¥38.0~~

本类畅销

2022图书×抽奖盲袋

¥9.9~~¥25~~
2023读书月阅读盲盒——天黑，闭眼，刀谁？

中图网

¥42.3~~¥158~~
2023读书月阅读盲盒——十万个为什么里面为什么没有我想问的为什么？

中图网

¥88~~¥260~~
2022读者节纪念徽章-三星会员专属

中图网

¥45~~¥45.6~~
2023读书月阅读盲盒——我什么场面没见过？

中图网

¥42.3~~¥158~~
2023读书月阅读盲盒——去码头整点什么薯条？

中图网

¥42.3~~¥158~~

基于Python的强化学习

基于Python的强化学习版权信息

基于Python的强化学习本书特色

基于Python的强化学习内容简介

基于Python的强化学习目录

基于Python的强化学习作者简介

龙榆生：词曲概论/大家小书

大红狗在马戏团-大红狗克里弗-助人

伊索寓言-世界文学名著典藏-全译本

姑妈的宝刀

朝闻道

巴金－再思录

唐代进士录

中国历史的瞬间

2022图书×抽奖盲袋

2023读书月阅读盲盒——天黑，闭眼，刀谁？

2023读书月阅读盲盒——十万个为什么里面为什么没有我想问的为什么？

2022读者节纪念徽章-三星会员专属

2023读书月阅读盲盒——我什么场面没见过？

2023读书月阅读盲盒——去码头整点什么薯条？

上海滩的贾斯汀·比伯

熊千佳昆虫记

朱仙镇年画:七日谈

女孩们

时间停止的那一天

陶潜和樱子

基于Python的强化学习

基于Python的强化学习 版权信息

基于Python的强化学习 本书特色

基于Python的强化学习 内容简介

基于Python的强化学习 目录

基于Python的强化学习 作者简介

基于Python的强化学习版权信息

基于Python的强化学习本书特色

基于Python的强化学习内容简介

基于Python的强化学习目录

基于Python的强化学习作者简介