大数据日知录:架构与算法
内容简介:
大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。
《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。
《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。
资源目录:
第0 章 当谈论大数据时我们在谈什么……………. 1
第1 章 数据分片与路由………………………………………. 9
第2 章 数据复制与一致性…………………………………………20
第3 章 大数据常用的算法与数据结构………………………………51
第4 章 集群资源管理与调度…………………………………71
第5 章 分布式协调系统……………………………..91
第6 章 分布式通信…………………………106
第7 章 数据通道…………………………………..120
第8 章 分布式文件系统………………………………131
第9 章 内存KV 数据库……………………………..168
第10 章 列式数据库…………………………………….176
第11 章 大规模批处理系统……………………………..199
第12 章 流式计算………………………………….219
第13 章 交互式数据分析……………………………..240
第14 章 图数据库:架构与算法…………………………..271
第15 章 机器学习:范型与架构…………………………………..313
第16 章 机器学习:分布式算法………………………….337
第17 章 增量计算……………………………………366
附录A 硬件体系结构及常用性能指标………………………………..378
附录B 大数据必读文献………………………………380
截图: