Spark MLlib机器学习实践(第2版)
云计算教程

Spark MLlib机器学习实践(第2版)

Spark MLlib机器学习实践(第2版) 内容简介: Spark作为新兴的、应用范围*为广泛的大数据处理开源框架引起了广泛的关注,它吸引了大量程序设计和开发人员进行相关内容的学习与开发,其中MLlib是Spark框架使用的核心。本书是一本细致介绍Spark MLlib程序设计的图书,入门简单,示例丰富。 本书分为13章,从Spark基础安装和配置开始,依次介绍MLlib程序设计基础、MLlib的数据对象构建、MLlib中RDD使用介绍,各种分类、聚类、回归等数据处理方法,*后还通过一个完整的实例,回顾了前面的学习内容,并通过代码实现了一个完整的分析过程。 本书理论内容由浅而深,采取实例和理论相结合的方式,讲解细致直观,适合Spark MLlib初学者、大数据分析和挖掘人员,也适合高校和培训学习相关专业的师生教学参考。 资源目录: 第1章  星星之火 1 1.1  大数据时代 1 1.2  大数据分析时代 2 1.3  简单、优雅、有效——这就是Spark3 1.4  核心——MLlib 4 1.5  星星之火,可以燎原 6 1.6  小结 6 第2章  Spark安装和开发环境配置 7 2.1 Windows单机模式Spark安装和配置 7 2.1.1 Windows 7安装Java 7 2.1.2 Windows 7安装Scala 10 2.1.3 Intellij IDEA下载和安装...
大数据治理与安全从理论到开源实践
云计算教程

大数据治理与安全从理论到开源实践

大数据治理与安全从理论到开源实践 内容简介: 作为大数据前沿的新兴领域,市面上大数据安全与治理的相关书籍屈指可数。本书在介绍大数据学术界新动态与大数据行业生产实践的同时,对大数据安全与治理的新理论与实践内容做了详尽的阐述。本书分为两部分:第壹篇(理论篇),介绍大数据治理与安全的理论、方法和技术挑战等;第二篇(开源实现篇),介绍开源社区各类开源项目,将研究与实践的内容根据不同组件分类。 资源目录: 前 言 第一篇 理论篇 第1章 大数据治理技术2 1.1 概述2 1.1.1 大数据治理的基本概念2 1.1.2 大数据治理的意义和重要作用5 1.2 框架7 1.2.1 大数据治理框架概述7 1.2.2 大数据治理的原则9 1.2.3 大数据治理的范围11 1.2.4 大数据治理的实施与评估14 第2章 大数据安全、隐私保护和审计技术19 2.1 大数据安全19 2.1.1 大数据安全的意义和重要作用19 2.1.2 大数据安全面临的问题与挑战21 2.1.3 大数据安全防护技术23 2.2 大数据隐私保护26 2.2.1 大数据隐私保护的意义和重要作用26 2.2.2 大数据隐私保护面临的问题与挑战28 2.2.3 大数据隐私保护技术31 2.3 大数据治理审计34 2.3.1 大数据治理审计概述34 2.3.2 大数据治理审计内容37 2.3.3 大数据治理审计方法和技术39 2.3.4 大数据治理审计流程43 第二篇 开源实现篇 第3章 大数据治理之Apache Falcon48 3.1 Apache Falcon概述48 3.1.1 Apache Falcon技术概况49 3.1.2 Apache Falcon发展近况50 3.1.3 Apache Falcon技术优势50 3.1.4 Apache Falcon架构51 3.2 Apache Falcon的使用53 3.2.1 Oozie的安装与配置56 3.2.2 Falcon的安装与配置61...
OpenStack部署实践
云计算教程

OpenStack部署实践

OpenStack部署实践 内容简介: 本书讲述了OpenStack 相关的内容,其内容来自各种部署实验与实践。书中首先介绍了PXE 和网络相关的内容,接着介绍了nova-network 安装模式、Quantum 安装模式、Quantum GRE 模式等,然后讨论了Cinder 部件、中央存储与虚拟机运态迁移、云服务的开放EC2 接口、RabbitMQ 的集群冗余架构等,最后简述了云监控系统Ceilometer、HEAT 组件以及Trove。 本书适合OpenStack 技术人员阅读。 资源目录: 第1章 OpenStack基本操作系统环境的PXE自动部署  1 1.1  PXE、kickstart与preseed简介  2 1.1.1  PXE简介  2 1.1.2  kickstart与preseed简介  2 1.2  PXE服务器的准备  3 1.2.1  选择Ubuntu操作系统  3 1.2.2  Ubuntu操作系统的基本安装与更新  3 1.3  复制Ubuntu和CentOS操作系统文件  6 1.3.1  复制Ubuntu操作系统全目录、内核与启动镜像文件  6 1.3.2  复制CentOS操作系统全目录、内核与启动镜像文件  7 1.4  PXE客户端操作系统的选择与引导过程  7 1.4.1  创建PXE客户端导示文件  7 1.4.2  选择安装配置文件  8 1.5  CentOS宿主机的kickstart配置文件  9 1.6  OpenStack计算节点的主机preseed配置文件  13 1.7...
大数据时代:生活、工作与思维的大变革
云计算教程

大数据时代:生活、工作与思维的大变革

大数据时代:生活、工作与思维的大变革 内容简介: 《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托迈尔舍恩伯格被誉为“大数据商业应用*人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。 维克托尔耶舍恩伯格在本书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。 维克托*洞见之处在于,他明确指出,大数据时代*的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。 本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、、IBM、苹果、facebook、twitter、VISA等大数据先锋们*价值的应用案例。 资源目录: 推荐序一拥抱“大数据时代” 推荐序二实实在在大数据 译者序 在路上·晃晃悠悠 引言一场生活、工作与思维的大变革 大数据,变革公共卫生 大数据,变革商业 大数据,变革思维 大数据,开启重大的时代转型 预测,大数据的核心 大数据,大挑战 第一部分大数据时代的思维变革 01 更多:不是随机样本,而是全体数据 让数据“发声” 小数据时代的随机采样,最少的数据获得最多的信息 全数据模式,样本=总体 02 更杂:不是精确性,而是混杂性 允许不精确 大数据的简单算法比小数据的复杂算法更有效 纷繁的数据越多越好 混杂性,不是竭力避免,而是标准途径 新的数据库设计的诞生 03 更好:不是因果关系,而是相关关系 林登与亚马逊推荐系统 关联物,预测的关键 “是什么”,而不是“为什么” 改变,从操作方式开始 大数据,改变人类探索世界的方法 第二部分大数据时代的商业变革 04 数据化:一切皆可“量化” 莫里的导航图,大数据的最早实践之一 数据,从最不可能的地方提取出来 数据化,不是数字化 量化一切,数据化的核心 当文字变成数据...
Docker技术入门与实战 第3版
云计算教程

Docker技术入门与实战 第3版

Docker技术入门与实战 第3版  内容简介: 本书从Docker基本原理开始,深入浅出地讲解Docker的构建与操作,内容系统全面,可帮助开发人员、运维人员快速部署Docker应用。本书分为四大部分:基础入门、实战案例、进阶技能、开源项目,*部分(第1~8章)介绍Docker与虚拟化技术的基本概念,包括安装、镜像、容器、仓库、数据卷、端口映射等;第二部分(第9~16章)通过案例介绍Docker的应用方法,包括与各种操作系统平台、SSH服务的镜像、Web服务器与应用、数据库的应用、各类编程语言的接口、容器云等,还介绍了作者在容器实战中的思考与经验总结;第三部分(第17~21章)介绍一些进阶技能,如Docker核心技术实现原理、安全、高级网络配置、libnetwork插件化网络功能等;第四部分(第22~28章)介绍与容器开发相关的开源项目,包括Etcd、Docker Machine、Docker Compose、Docker Swarm、Mesos、Kubernetes等。第3版根据 Docker 18.x 系列版本对全书内容进行了全面修订。 资源目录: 第3版前言 第一部分 基础入门 第1章 初识Docker与容器 3 1.1 什么是Docker 3 1.2 为什么要使用Docker 6 1.3 Docker与虚拟化 8 1.4 本章小结 9 第2章 核心概念与安装配置 10 2.1 核心概念 10 2.2 安装Docker引擎 11 2.2.1 Ubuntu 环境下安装 Docker 12 2.2.2 CentOS 环境下安装 Docker 14 2.2.3 通过脚本安装 15 2.2.4 macOS环境下安装 Docker 15 2.2.5 Windows环境下安装Docker 23 2.3 配置 Docker...
SOA架构:服务和微服务分析及设计(原书第2版)
云计算教程

SOA架构:服务和微服务分析及设计(原书第2版)

SOA架构:服务和微服务分析及设计(原书第2版) 内容简介: 本书一直以来都是在SOA、面向服务和服务技术方面的、端到端的教程。如今,已经更新到第2版,正式引入微服务和微任务抽象,作为面向服务架构及其相关服务层的一部分。新版的案例研究示例和图例进一步阐释和定位微服务模型,并与更传统的服务类型相关联。本书可作为应用架构师、企业架构师、软件开发人员以及任何有兴趣了解或负责设计与实现现代、面向服务解决方案的IT专业人士的参考书。 资源目录: 译者序 致谢 第1章 概述 1 1.1 本书中如何使用模式 2 1.2 涵盖第1版主题的系列书籍 2 1.3 本书的组织形式 3 1.4 原则、约束条件和设计模式 4 1.5 附加信息 5 第2章 案例研究背景知识 7 2.1 如何应用案例研究 7 2.2 案例研究背景1:Transit Line Systems, Inc. 7 2.3 案例研究背景2:Midwest University Association 7 第一部分 基本原理 第3章 理解面向服务 10 3.1 面向服务简介 10 3.1.1 业务自动化中的服务 11 3.1.2 服务是能力的集合 12 3.1.3 面向服务是一种设计范式 13 3.1.4 面向服务的设计原则 15 3.2 面向服务所解决的问题 16...
VMware vSphere企业运维实战
云计算教程

VMware vSphere企业运维实战

VMware vSphere企业运维实战 内容简介: 《VMware vSphere企业运维实战》主要介绍VMware vSphere企业运维的内容,包括虚拟化的实施规划、从已有物理服务器迁移到虚拟服务器、数据中心实时管理、数据中心动态管理、虚拟机的备份与恢复、VMware虚拟云基础架构vCloud Director等内容。   《VMware vSphere企业运维实战》介绍了大量先进的虚拟化应用技术,步骤清晰(使用Step By Step的教学方法),非常容易学习和快速掌握,可供虚拟机技术爱好者、政府信息中心管理员、企业和网站的网络管理员、计算机安装及维护人员、软件测试人员、程序设计人员、教师及学生等作为网络改造、虚拟化应用、网络实验、测试软件、教学演示等用途的参考手册,也可以作为培训机构的教学用书。 资源目录: 第1章 企业虚拟化实施规划  1.1 CIO的顾虑  1.2 企业虚拟化进程  1.3 如何利用现有基础架构  1.4 服务器性能与容量规划  1.5 统计与计算现有容量  1.6 服务器的选择  1.7 存储的选择  1.8 网络及交换机的选择  第2章 从物理机到虚拟机  2.1 在闲置或新购服务器安装配置虚拟化主机  2.1.1 VMware ESXi的硬件需求  2.1.2 规划VMware ESXi分区  2.1.3 安装VMware ESXi  2.2 VMware ESXi 5控制台设置  2.2.1 进入控制台界面  2.2.2 修改管理员口令  2.2.3 配置管理网络  2.2.4 启用ESXi Shell与SSH  2.2.5 恢复系统配置  2.2.6 VMware ESXi的关闭与重启  2.3 vSphere ESXi基本管理与配置  2.3.1 vSphere Client的安装  2.3.2 在Windows XP或2003主机安装vSphere...
DT时代_从“互联网_”到“大数据×”
云计算教程

DT时代_从“互联网_”到“大数据×”

DT时代_从“互联网_”到“大数据×” 内容简介: 作者简介】本书的编委会为贵州市大数据战略重点实验室,负责承担贵阳市委、市政府交办的重大调研课题。它是一个跨学科、专业化、国际化、开放型研究平台,是具有较大影响力和国际知名度的大数据高端战略智库。 【内容简介】知识就是力量,信息就是能量,数据就是变量。连玉明编著的《DT时代》全面阐述了人类从IT时代走向DT时代的基本特征和规律。本书认为,大数据正成为人类的第二母语,大数据已经成为DT时代一个国家最重要的战略资源之一。 DT不仅仅是技术的提升,而是思想的革命。本书首次提出块数据的数量(volume)、速度(velocity)、多样(variety)、价值(value)和数聚(variable)的五V空间理论,将对大数据的认知推进到新的高度。本书认为,块数据作为大数据的解决方案,实现了从数据到数聚、从解构到重构、从多维到共享的跨越,块数据社会、慢数据决策和流数据价值三位一体,标志着大数据时代的真正到来。 本书强调,众联、众包、众创、众筹为人们越来越熟知,平等思维、共享思维、扁平化思维、跨界思维、场景思维被越来越多地掌握和运用。把大数据产业作为创新驱动的引领性产业,是实现经济发展和生态保护双赢的 选择。 本书还提出,安全是大数据的生命线。以大数据技术对抗大数据平台安全威胁是大数据成功的必由之路,在此基础上本书对大数据立法问题进行了探讨并提出,必须建立健全安全防护体系,切实强化大数据安全管理和“公开的隐私”的保护。只有更好的保护,才有更好的分享。 资源目录: 世界十大华文传媒推荐语 序 大数据:人类的第二母语 前言 从IT时代到DT时代 第一篇 大数据趋势 第一章 大数据正在解构和重构世界 第二章 大数据颠覆传统思维范式 第三章 大数据塑造新的生活方式 第二篇 大数据战略 第四章 前瞻发达国家大数据浪潮 第五章 新兴市场与东亚国家大数据变革 第六章 转型:数据中国 第三篇 大数据经济 第七章 智慧经济:我“数”故我在 第八章 共享经济:从创新力到必信力 第九章 众创经济:大数据、小巨人 第四篇 大数据服务 第十章 个性化定制:未来服务的新形态 第十一章 互联网金融:没有银行的世界 第十二章 智慧服务链:理念+技术+模式...
大数据的冲击
云计算教程

大数据的冲击

大数据的冲击 内容简介: 《大数据的冲击》是日本最畅销的大数据商业应用指南。书中结合野村综合研究独家披露的调查数据,网罗了美国、日本标杆企业与政府的应用案例,总结了大数据的商业模式,以及在大数据应用中需要注意的隐私问题,并就如何为大数据时代做好准备展开了深入的探讨,提出了诸多有益的建议。   《大数据的冲击》适合商业人士以及与大数据相关的IT从业者阅读。 资源目录: 第1章 什么是大数据 1.1  The data deluge 1.2  用3V来描述大数据的特征 1.3  广义的大数据 1.4  为什么现在要谈大数据?①大数据的民主化 1.5  为什么现在要谈大数据?②硬件性价比的提高以及软件技术的进步 1.6  为什么现在要谈大数据?③云计算的普及 1.7  从“看到过去”到“预测未来”BI与大数据的交叉 1.8  从点(交易数据)分析到线(交互数据)分析 1.9  大数据的分析工具 本章小结 第2章 支撑大数据的技术 2.1  人手不足 2.2  什么是Hadoop 2.3  发行版本的增加 2.4  发行版本众多的原因 2.5  NoSQL数据库 2.6  风投资本对Hadoop、NoSQL企业的热切关注 2.7  大数据时代的数据处理基础 2.8  备受关注的分析型数据库 2.9  流数据处理(实时数据处理)...