Python强化学习：算法、核心技术与行业应用最新章节全文无弹窗在线阅读-QQ阅读女生现言网

QQ阅读女生青春网

女生青春网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分：第一部分涵盖强化学习的必要背景，包括定义、数学基础和强化学习解决方案的概述；第二部分深入介绍最先进的强化学习算法（规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等），包括每种算法的优缺点；第三部分介绍强化学习中的高级技术，包括机器教学、泛化和域随机化、元强化学习等主题，还涵盖强化学习中有助于改进模型的各种高级主题；第四部分讲解强化学习的各种应用，例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等，并讨论强化学习领域的一些挑战及未来方向。学完本书，你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。

品牌：机械工业出版社

译者：朱小虎等

上架时间：2023-10-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)埃内斯·比尔金

同类热门书

最新上架

会员
巧用ChatGPT进行数据分析与挖掘
这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作，又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。从读者对象的角度看，本书既大大降低了没有编程经验的读者学习Python数据分析的门槛，又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧，帮助他们快速转型为具备AI能力的数据分析师。从核心内容的角
谢佳标计算机16.9万字
会员
智能控制与强化学习：先进值迭代评判设计
在人工智能技术的大力驱动下，智能控制与强化学习发展迅猛，先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题，以实现稳定学习、演化学习和快速学习为目标，建立一套先进的值迭代评判学习控制理论与设计方法。首先，对先进值迭代框架下迭代策略的稳定性进行全面深入的分析，建立一系列适用于不同场景的稳定性判据，从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
王鼎赵明明哈明鸣任进计算机8.7万字
会员
智能计算系统：从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就，以“图像风格迁移”应用为例，全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新，第1章回顾人工智能、智能计算系统的发展历程，第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识，第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法，第5章介绍编程框架的工作原理，第6章回顾深度学习所用的处理器结构从
陈云霁等编著计算机34.9万字
会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战：深度加深模型退化和监督信息过度依赖。针对这两大挑战，本书提出了一系列解决思路，涵盖模型结构设计、训练策略优化等方面的内容。全书共7章，第1章主要介绍了图神经网络研究的背景与意义，阐述了近年来国内外网络表示学习与图神经网络的研究现状，分析了图神经网络当前面临的挑战及其主要问题等；第2章主要对图神经网络进行概要论述，包括基础的理论、典型的模型方法及应用
王杰计算机8.1万字
会员
机器学习（第2版）
机器学习是人工智能的重要技术基础，涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识，主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识，还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外，本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。本书深入浅出、内容
赵卫东董亮编著计算机30.2万字
会员
ChatGLM3大模型本地化部署、应用开发与微调
《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch2.0深度学习从零开始学》的姊妹篇，专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论，更注重实践应用，通过丰富的案例和场景，引导读者从理论走向实践，真正领悟和掌握大模型本地化应用的精髓。全书共分13章，全方位、多角度地展示了大模型本地化
王晓华计算机13万字
会员
破解深度学习（基础篇）：模型算法与实现
本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章，深入浅出地介绍了深度学习的理论与算法基础，从理论到实战全方位展开。前三章旨在帮助读者快速入门，介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络，从最简单的多层感知机开始，讲解了深度神经网络的基本原理、常见挑战、优化算法，以及三大典型模型（基础卷积神经网络、基础循环神经网络和注意力神
瞿炜李力杨洁计算机14.8万字
会员
奇点到来：AIGC引爆增长新范式
增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法，本书作为该领域的入门级读物，介绍了AIGC在增长领域的技术和实战应用。本书分为4部分，第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者；第3部分包含AI的基础知识、基础模型，并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源
范磊黄志坚杨永强王山雨计算机21.9万字
会员
PyTorch深度学习应用实战
《PyTorch深度学习应用实战》以统计学/数学为出发点，介绍深度学习必备的数理基础，讲解PyTorch的主体架构及最新的模块功能，包括常见算法与相关套件的使用方法，例如对象侦测、生成对抗网络、深度伪造、图像中的文字辨识、脸部辨识、BERT/Transformer、聊天机器人、强化学习、自动语音识别、知识图谱等。本书配有大量案例及图表说明，同时以程序设计取代定理证明，缩短学习过程，增加学习乐趣。
陈昭明洪锦魁计算机15.2万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 abook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015