Spark大数据处理：技术、应用与性能优化最新章节全文无弹窗在线阅读-QQ阅读女生青春网

QQ阅读女生青春网

女生青春网

达人推广书架浏览历史

登录 | 注册

书籍简介

这是一本依据最新技术版本，系统、全面、详细讲解Spark的著作，作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容；然后从应用角度讲解了一些简单的、有代表性的案例；最后对Spark的性能优化进行了探讨。

品牌：机械工业出版社

上架时间：2014-11-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

高彦杰

同类热门书

最新上架

会员
深入理解InfluxDB：时序数据库详解与实践
时序数据库是一种新型技术，主要用于工业互联网软件建设中。近年来，伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展，时序数据库也发展迅速，成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始，一步步详细介绍InfluxDB的功能及原理，带领读者深入理解以InfluxDB为代表的时序数据库。
郑强张伟刘爽计算机7.6万字
会员
MySQL 8.0从入门到实战
MySQL数据库是目前全球流行的数据库之一。《MySQL8.0从入门到实战》从入门到实战，系统全面、由浅入深地介绍MySQL数据库应用的各个方面。全书分为8个部分，共18章。第1部分（第1~3章）介绍MySQL的基础知识，包括初识MySQL、数据库设计和数据类型；第2部分（第4~6章）介绍MySQL的基本操作，包括SQL基础操作、MySQL连接查询和数据复制、MySQL基础函数；第3部分（第7、8
张文亮编著计算机9.7万字
会员
数据库原理及应用实验：基于GaussDB的实现方法
本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分：第一部分为实验指导，共有13个综合实验，每一个实验都是根据教学目标而设计，详细讲述了每一个实验的实验目的、实验任务及实验步骤，从而培养学生掌握关系数据库管理软件技术与应用的技能；第二部分为习题集，是根据主教材各章节内容编写的习题及习题答案，内容广泛，有填空、选择、简答、设计及实验题等多种形式，利求通过对这些习题的训
李雁翎编著计算机6.9万字
会员
算力芯片：高性能CPU/GPU/NPU微架构分析
本书介绍了超级计算机算力和AI算力的异同，从CPU流水线开始，描述主要的众核处理器架构和功能部件设计。在GPU和NPU等加速器部分，介绍了GPU为何能从单纯的图形任务处理器变成通用处理器。GPU在设计逻辑、存储体系、线程管理，以及面向AI的张量处理器方面成为最近几年全世界科技行业最瞩目的明星。本书对华为等厂商推出的NPU芯片设计也做了架构描述，回顾了近20年来主流的CPU、GPU芯片架构的特点，介
濮元恺计算机29.3万字
会员
分布式数据库：原理与实践
本书全方位讲解分布式数据库的知识点，由易到难、由浅入深地带领读者在分布式数据领域不断深入。第1章主要介绍分布式数据库的起源与发展，并就分布式数据库的结构模式、作用及特点进行详细讲解。第2章主要对分布式技术、分布式服务架构、云数据库与容器化技术、大数据平台、分布式存储与数据库以及区块链技术进行详细介绍。第3章主要从分布式的基础理论、分布式事务分类以及分布式数据库分类、SequoiaDB数据库展开介绍
强彦主编计算机7.9万字
会员
数据分析实践：专业知识和职场技巧
《数据分析实践：专业知识和职场技巧》从初学者的角度出发，讲解了进阶为高级数据分析师所需的知识和技能，其中既包括数据分析岗位的介绍、发展现状及未来趋势，也包括实际工作中各环节的方法策略、实战案例，还包括职场中的困惑解答及面试指导。阅读本书，并基于本书进一步拓展所需要的知识能，可以帮助读者形成一套成系统、可实战的数据分析方法论。
姜文哲计算机19.6万字
会员
数据指标体系：构建方法与应用实践
这是一套数据指标体系全流程构建（从规划、框架设计、数据采集加工到应用）方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略，还通过多个行业实例展示了具体操作方法。书中从数据采集入手，借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨，本书除了包含数据指标体系构建相关内容外，还结合统计学原理及Excel、Python等工具，深入剖析数据指标波动对业务的影
李渝方计算机12.7万字
会员
数据质量实践手册：4步构建高质量数据体系
高质量的数据关乎企业运营、合规、决策和业绩的关键，哈佛商业评论的一项研究发现，企业中只有3%的数据符合质量标准，绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验，阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法（定义、评估、实现、持续）和10个数据质量最佳实践案例，以此来提高业务中的数据质量水平，为业务提供数据价值，保证
(美)普拉桑特·苏特卡尔计算机11.7万字
会员
PySpark大数据分析与应用
本书以Python作为开发语言，系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出，理论叙述循序渐进、由浅入深。本书共7章，第1？5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库，内容介绍注重理论与实践相结合，通过典型示例
戴刚张良均主编计算机10.4万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 abook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015