题名:
|
强化学习 qiang hua xue xi / 龚超 ... [等] 著 , |
ISBN:
|
978-7-122-45282-5 价格: CNY69.80 |
语种:
|
chi |
载体形态:
|
234页 图 21cm |
出版发行:
|
出版地: 北京 出版社: 化学工业出版社 出版日期: 2024 |
内容提要:
|
本书内容包含强化学习方向的基础知识, 如动态规划、时序差分等, 让读者在开始学习时对强化学习有初步的认识; 之后, 通过对马尔可夫决策过程及贝尔曼方程的解读, 逐渐过渡到强化学习的关键内容; 同时, 本书也解析了策略迭代与价值迭代两种核心算法, 也对蒙特卡洛方法、时序差分算法、深度强化学习及基于策略的强化学习算法进行了剖析。 |
主题词:
|
人工智能 |
中图分类法:
|
TP18-49 版次: 5 |
其它题名:
|
人工智能如何知错能改 |
主要责任者:
|
龚超 gong chao 著 |
主要责任者:
|
王冀 wang ji 著 |
主要责任者:
|
梁霄 liang xiao 著 |
责任者附注:
|
龚超, 工学博士, 清华大学日本研究中心主任助理, 中日创新中心主任研究员, 深圳清华大学研究院下一代互联网研发中心核心成员, 海口经济学院雅和人居工程学院客座教授。王冀, 工学博士, 西北工业大学计算机学院助理教授, 研究方向为关键数据提取及图像编码。梁霄, 中国人民大学附属中学教师, 信息学竞赛教练, 本科毕业于清华大学电子工程系, 博士毕业于清华大学计算机系。 |