Hadoop构建数据仓库实践最新章节全文无弹窗在线阅读-QQ阅读女生青春网

QQ阅读女生青春网

女生青春网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库，将传统数据仓库建模与SQL开发的简单性与大数据技术相结合，快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念，使用Sqoop从关系数据库全量或增量抽取数据，使用HIVE进行数据转换和装载处理，使用Oozie调度作业周期性执行，使用Impala进行快速联机数据分析，使用Hue将数据可视化，以及数据仓库中的渐变维（SCD）、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员，也适合高等院校和培训机构相关专业的师生教学参考。

品牌：清华大学

上架时间：2017-07-01 00:00:00

出版社：清华大学出版社

本书数字版权由清华大学提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

同类热门书

最新上架

会员
ETL数据整合与处理（Kettle）
本书以Kettle实现ETL流程为目标，将ETL知识点与任务相结合，配套真实案例，深入浅出地介绍了ETL数据整合与处理的相关内容。全书共8章，第1章介绍了ETL概念和ETL工具，让读者在了解ETL相关的概念后，立刻上手ETL工具Kettle；第2~6章介绍了Kettle工具转换相关的组件，包括源数据获取、记录处理、字段处理、高级转换、迁移和装载等内容，内容与ETL流程匹配，能帮助读者快速掌握ETL
王雪松张良均主编计算机8.1万字
会员
大数据SQL优化：原理与实践
这是一本站在一线开发人员的视角，从SQL的本质出发，采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式，深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员，期望帮大家深度理解大数据SQL优化原理，掌握SQL优化的落地实践方法，从而真正“玩转”大数据SQL优化技术，根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
陈鹤杨国栋计算机14万字
会员
算法设计与分析
为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法，本书按照算法策略进行划分，每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章，内容包括：算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用
张小东主编计算机9.4万字
会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇，第1篇是基础入门篇，主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础；第2篇是数据分析篇，主要介绍常用的数据分析方法；第3篇是数据挖掘篇，主要介绍常用的数据挖掘方法；第4篇是实战应用篇，介绍两个完整的数据分析与挖掘案例。
熊熙张雪莲编著计算机10.9万字
会员
云计算服务保障体系
云计算是一种商业计算模型，它将计算任务分布在大量计算机构成的资源池上，使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同，云计算环境下，信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构，安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型；服务
林果园计算机9.5万字
会员
Power BI商业数据分析完全自学教程
本书共5篇，分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇（第1-3章），主要针对初学者，从零开始，系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇（第4-6章），介绍了PowerBI数据的整理操作、表格中行/列数据的管理，以及PowerBI数据的高级处理、M函数的使
凤凰高新教育编著计算机0字
会员
Python数据分析
本书系统介绍了使用Python进行数据分析需要掌握的各项知识，涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用，帮助读者更好地运用Pyth
王俊主编计算机12.3万字
会员
新媒体数据分析基础教程
本书共8章，第1章介绍新媒体数据分析的基础知识；第2章介绍各种新媒体数据分析指标；第3章介绍新媒体数据的采集；第4章介绍新媒体数据处理；第5章介绍新媒体数据分析的思维和方法；第6章介绍新媒体数据可视化；第7章介绍不同新媒体平台的数据分析方法和实战技能；第8章介绍新媒体数据分析报告的制作。
赵春红计算机9.2万字
会员
云数据中心基础
本教材共介绍7个项目，项目1为云数据中心认知，主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计，主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型，主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云
戴经国何丰王国滨郭炳宇姜善永计算机12.1万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 abook.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015