乐于分享
好东西不私藏

【2023新书】强化学习基础,97页pdf

【2023新书】强化学习基础,97页pdf

人工智能 (AI) 应用为我们的生活带来了敏捷性和现代性,而增强学习技术正处于这项技术的前沿。在策略游戏、创意组合和自主运动方面,它可以超越人类竞争者。更重要的是,它刚开始改变我们的文明。

本书介绍了AI的基础知识,详述了机器学习技术,并探索了增强学习的各个方面,以教育性和插图的方式介绍最新概念。它面向那些希望成为技术进步一部分的学生,以及参与开发创新应用的教授,帮助他们应对学术和工业上的挑战。

理解增强学习的基础知识将使你能够:

  • 理解关键的AI概念
  • 获得专业经验
  • 解释序列决策问题,并使用增强学习来解决它们
  • 了解Q-Learning算法如何工作
  • 使用带有注释的Python代码进行实践
  • 找到有利的方向

这本书涵盖了人工智能的基本概念,穿越了机器学习并深入探讨了RL,既有理论又有实践。在各章节中,有用虚线标出的灰色信息块,这些信息块提供了工具和补充信息的链接,作为技巧并扩展了本书的资源。本书的组织始终从总览转向更为具体的视角。每一章也是如此。因此,学生可以按顺序阅读,或根据需要及时参考各章,如下:

第1章介绍人工智能的研究领域,以及区分各种机器学习方法和它们解决的问题类型。通过有趣的例子生动地介绍了增强学习的含义,并解释了其框架。然后,探讨了渗透多个科学领域的相关历史里程碑,这些里程碑对这一研究方向的发展做出了贡献。

第2章涵盖了理解涉及增强学习的整个系统所需的基本知识。讨论了如代理、环境、动作、奖励、策略和价值函数等概念。提供了例子和类比来帮助解释这些概念,从Markov链的问题结构开始,经过Watkins和Dayan的提议,展开为Bellman方程。最后,介绍了在这一创新研究领域中取得成功的算法的类别和特点。

第3章描述了增强学习中最常用的算法之一——Q-Learning算法的逐步操作。呈现了算法的每个组件的含义及其通过伪代码的演示。然后,通过代理在环境中互动的视觉例子详细解释了算法的工作原理,从Q-Table的初始化到代理根据与环境的经验进行决策,再到构建要遵循的策略。

第4章涉及用于开发增强学习解决方案的实用工具。讨论了一些主要的库和框架,可用于实现RL算法,如TensorFlow、Keras和OpenAI Gym。还讨论了一些用于进行RL实验的有用数据源。

第5章提出了使用Python开发自主出租车的AI的实际案例。讨论了环境的细节,并举例说明了代理在不使用AI的情况下的行动。作为对比,接下来简化地展示了如何实现一个RL算法。代码带有注释,并详细解释,说明在这类问题中使用RL的差异和优势。该系统可供进一步测试和实施。

第6章展示了增强学习如何影响各个知识领域的最新应用。介绍了RL在机器人技术、游戏、教育和量子力学等领域的应用实例。还讨论了RL应用在不同领域的主要优势和挑战,以及在这些领域未来使用RL的展望。

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复或发消息“RL97” 就可以获取《【2023新书】强化学习基础,97页pdf》专知下载链接

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料
×
订阅图标按钮