Python强化学习:算法、核心技术与行业应用在线阅读
会员

Python强化学习:算法、核心技术与行业应用

(美)埃内斯·比尔金
开会员,本书免费读 >

计算机网络人工智能19.5万字

更新时间:2024-04-15 11:58:27 最新章节:文后

立即阅读
加书架
下载
听书

书籍简介

本书使用受现实世界商业和行业问题启发的实际示例来讲授强化学习技术的相关知识。本书分为四部分:第一部分涵盖强化学习的必要背景,包括定义、数学基础和强化学习解决方案的概述;第二部分深入介绍最先进的强化学习算法(规模化的深度Q-学习、基于策略的方法、基于模型的方法、多智能体强化学习等),包括每种算法的优缺点;第三部分介绍强化学习中的高级技术,包括机器教学、泛化和域随机化、元强化学习等主题,还涵盖强化学习中有助于改进模型的各种高级主题;第四部分讲解强化学习的各种应用,例如自主系统、供应链管理、营销和金融、智慧城市与网络安全等,并讨论强化学习领域的一些挑战及未来方向。学完本书,你将掌握如何训练和部署自己的强化学习智能体来解决强化学习问题。
品牌:机械工业出版社
译者:朱小虎等
上架时间:2023-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

(美)埃内斯·比尔金
主页

同类热门书

最新上架

  • 会员
    这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作,又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。从核心内容的角
    谢佳标计算机16.9万字
  • 会员
    在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
    王鼎 赵明明 哈明鸣 任进计算机8.7万字
  • 会员
    本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从
    陈云霁等编著计算机34.9万字
  • 会员
    本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用
    王杰计算机8.1万字
  • 会员
    机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书涵盖了机器学习和深度学习的基础知识,主要包括机器学习的概述、统计学基础、分类、聚类、神经网络、贝叶斯网络、支持向量机、文本分析、分布式机器学习算法等经典的机器学习基础知识,还包括卷积神经网络、循环神经网络、生成对抗网络、目标检测、自编码器等深度学习的内容。此外,本书还介绍了机器学习的热门应用领域推荐系统以及强化学习等主题。本书深入浅出、内容
    赵卫东 董亮编著计算机30.2万字
  • 会员
    《ChatGLM3大模型本地化部署、应用开发与微调》作为《PyTorch2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等。《ChatGLM3大模型本地化部署、应用开发与微调》不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。全书共分13章,全方位、多角度地展示了大模型本地化
    王晓华计算机13万字
  • 会员
    本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神
    瞿炜 李力 杨洁计算机14.8万字
  • 会员
    增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法,本书作为该领域的入门级读物,介绍了AIGC在增长领域的技术和实战应用。本书分为4部分,第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者;第3部分包含AI的基础知识、基础模型,并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源
    范磊 黄志坚 杨永强 王山雨计算机21.9万字
  • 会员
    《PyTorch深度学习应用实战》以统计学/数学为出发点,介绍深度学习必备的数理基础,讲解PyTorch的主体架构及最新的模块功能,包括常见算法与相关套件的使用方法,例如对象侦测、生成对抗网络、深度伪造、图像中的文字辨识、脸部辨识、BERT/Transformer、聊天机器人、强化学习、自动语音识别、知识图谱等。本书配有大量案例及图表说明,同时以程序设计取代定理证明,缩短学习过程,增加学习乐趣。
    陈昭明 洪锦魁计算机15.2万字