Hadoop应用架构

内容简介:

-使用Hadoop进行数据存储和建模的着眼点和思路

-将数据输入、输出系统的最佳方案

-MapReduce、Spark和Hive等数据处理框架介绍

-数据去重、窗口分析等常见Hadoop处理模式应用

-在Hadoop上采用Giraph、GraphX等图形处理工具

-综合使用工作流以及Apache Oozie等调度工具

-以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理

-点击流分析、欺诈检验和数据仓库的架构案例

本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。

为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。

资源目录:

版权声明

O'Reilly Media, Inc. 介绍

译者序

前言

第一部分 考虑 Hadoop 应用的架构设计

第 1 章 Hadoop 数据建模

第 2 章 Hadoop 数据移动

第 3 章 Hadoop 数据处理

第 4 章 Hadoop 数据处理通用范式

第 5 章 Hadoop 图处理

第 6 章 协调调度

第 7 章 Hadoop 近实时处理

第二部分 案例研究

第 8 章 点击流分析

第 9 章 欺诈检测

第 10 章 数据仓库

附录 A Impala 中的关联

作者简介

封面介绍

截图:

Hadoop应用架构

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理