Storm分布式实时计算模式

内容简介:

《Storm分布式实时计算模式》全书分为10章:第1章介绍使用Storm建立一个分布式流式计算应用所涉及的核心概念,包括Storm的数据结构、开发环境的搭建,以及Storm程序的开发和调试技术等;第2章详细讲解Storm集群环境的安装和搭建,以及如何将topology部署到分布式环境中;第3章通过传感器数据实例详细介绍Trident topology;T第4章讲解如何使用Storm和Trident进行实时趋势分析;第5章介绍如何使用Storm进行图形分析,将数据持久化存储在图形数据库中,并且查询数据来发现其中潜在的联系;;第6章讲解如何在Storm上使用递归实现一个典型的人工智能算法;第7章演示集成Storm和非事务型系统的复杂性,通过集成Strom和开源探索性分析架构Druid,实现一个可配置的实时系统来分析金融事件。第8章探讨Lambda体系结构的实现方法,讲解如何将批处理机制和实时处理引擎结合起来构建一个可纠错的分析系统;第9章 讲解如何将Pig脚本转化为topology并且使用Storm-YARN部署topology,将批处理系统转化为实时系统;第10章 介绍如何在云服务提供商提供的主机环境下部署和运行Storm。

资源目录:

前言

作者简介

第1章 分布式单词计数

1.1 Storm topology的组成部分——stream、spout和bolt

1.1.1 Storm

1.1.2 spout

1.1.3 bolt

1.2 单词计数topology的数据流

1.2.1 语句生成bolt

1.2.2 语句分割bolt

1.2.3 单词计割bolt

1.2.4 上报bolt

1.3 实现单词计数top

1.3.1 配置开发环境

1.3.2 实现Sentence

1.3.3 实现语句分割bolt

1.3.4 实现单词计割bolt

1.3.5 实现上报bolt

1.3.6 实现单词计数topo

1.4 Storm的并发机制

1.4.1 WordCountTopology的并发机制

1.4.2 给topology增加woker

1.4.3 配置executor和task

1.5 理解数据流分组

1.6 有保障机制的数据处理

1.6.1 spout的可靠性

1.6.2 bolt的可靠性

1.6.3 可靠的单词计数

总结

第2章 配置Storm集群

2.1 Storm集群的框架

2.1.1 理解nimbus守护进程

2.1.2 supervisor守护进程的工作方式

2.1.3 Apache ZooKeeper简介

……

第3章 Trident和传感器数据

第4章 实时趋势分析

第5章 实时图形分析

第6章 人工智能

第7章 整合Druid进行金融分析

第8章 自然语言处理

第9章 在Hadoop上部署Storm进行广告分析

第10章 云环境下的S

截图:

Storm分布式实时计算模式

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理