机读格式显示(MARC)
- 000 01729nam0 2200325 450
- 010 __ |a 978-7-121-32918-0 |d CNY79.00
- 100 __ |a 20180118d2018 em y0chiy50 ea
- 200 1_ |a 深入浅出强化学习 |9 shen ru qian chu qiang hua xue xi |b 专著 |e 原理入门 |f 郭宪,方勇纯编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2018.01
- 215 __ |a 16,239页 |c 图 |d 24cm
- 314 __ |a 郭宪,南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016年1月获得工学博士学位,期间在国内外知名杂志和会议发表论文数十篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习、深度强化学习等智能算法在机器人领域中的应用。
- 330 __ |a 本书介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
- 701 _0 |a 郭宪 |9 guo xian |4 编著
- 701 _0 |a 方勇纯 |9 fang yong chun |4 编著
- 801 _0 |a CN |b 浙江省新华书店集团公司 |c 20180118
- 801 _2 |a CN |b LIY |c 20181115
- 905 __ |a SYXY |d TP18/89
- 907 __ |a SYXY |y 2018 |h |d TP18 |r CNY79.00 |e 89