Spark大数据处理技术
Spark大数据处理技术 内容简介: 《Spark大数据处理技术》以Spark 0.9版本为基础进行编写,是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和Spark SQL、流式处理引擎Spark Streaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。 《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。 资源目录: 第1章 Spark系统概述 1 1.1 大数据处理框架 1 1.2 Spark大数据处理框架 3 1.2.1 RDD表达能力 3 1.2.2 Spark子系统 4 1.3 小结 7 第2章 Spark RDD及编程接口 9 2.1 Spark程序“Hello World” 9 2.2 Spark RDD 12 2.2.1 RDD分区(partitions) 13 2.2.2 RDD优先位置(preferredLocations) 13 2.2.3 RDD依赖关系(dependencies)...