spark graphX实战
spark graphX实战 内容简介: 《Spark GraphX实战》是一本Spark GraphX入门书籍。前5章为基础内容,即使读者对Spark、GraphX、Scala不熟悉,也能快速上手;后5章为图计算进阶,主要是图算法和机器学习算法的相关内容。专门讲图计算的书很少,《Spark GraphX实战》在第2、3、4章介绍了图的基础知识、GraphX基础知识、GraphX内置的图算法。第6章到第10章,主要介绍了GraphX之外的图算法、机器学习、图工具、GraphX监控和优化、GraphX的能力增强等实用技能。第9章和第10章主要介绍性能调优和监控,主要面向生产环境,有不少可以借鉴的技巧。 《Spark GraphX实战》面向对图计算感兴趣的读者,旨在帮助读者掌握Spark GraphX的相关知识及其应用。 资源目录: 序言 XI 致谢XIII 关于本书 XIV 关于封面插图 XVIII 第1部分 Spark和图 1 两项重要的技术:Spark和图 3 1.1 Spark:超越Hadoop MapReduce 4 1.1.1 模糊的大数据定义 6 1.1.2 Hadoop:Spark之前的世界 6 1.1.3 Spark:内存中的 MapReduce处理 7 1.2 图:挖掘关系中的含义 9 1.2.1 图的应用 11 1.2.2 图数据的类型 12 1.2.3 普通的关系型数据库在图方面的不足 14 1.3 把快如闪电的图处理放到一起:Spark GraphX 14 1.3.1 图的属性:增加丰富性 15 1.3.2 图的分区:当图变为大数据集时 17...