数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版
云计算教程

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版 第1章二次排序:简介 19第2章二次排序:详细示例 42第3章 Top 10 列表 54第4章左外连接 96第5章反转排序 127第6章移动平均 137第7章购物篮分析 155第8章共同好友 182第9章使用MapReduce实现推荐引擎 201第10章基于内容的电影推荐 225第11章使用马尔可夫模型的智能邮件营销 .253第12章 K-均值聚类 282第13章 k-近邻 296第14章朴素贝叶斯 315第15章情感分析 349第16章查找、统计和列出大图中的所有三角形 354第17章 K-mer计数 375第18章 DNA测序 390第19章 Cox回归 413第20章 Cochran-Armitage趋势检验 426第21章等位基因频率 443第22章 T检验 468第23章皮尔逊相关系数 488第24章 DNA碱基计数 520第25章 RNA测序 543第26章基因聚合 553第27章线性回归 586第28章 MapReduce和幺半群 600第29章小文件问题 622第30章 MapReduce的大容量缓存...
Ajax高级程序设计_前端开发教程
前端教程

Ajax高级程序设计_前端开发教程

资源名称:Ajax高级程序设计 内容简介: 本书是一本关于Ajax技术、模式和使用场景的开发人员级教程,不仅介绍了Ajax的基本知识,还讨论了Ajax模式和框架,同时针对XML(包括XPath和XSLT)、RSS/Atom、Web服务、JSON和Web用户界面组件等主题,阐述了如何将Ajax和这些技术有效地结合在一起,并利用Ajax开发的一个Web Mail系统实例。书中经典的实例、完整的源代码,都将给读者带来“实战”的指导。与本书配套的源代码可以在图灵网站下载。 本书内容广泛且深入,适用于中高层次的Web网站开发人员。 资源目录: 第1章 什么是Ajax   1.1 Ajax的诞生   1.2 Web的演化过程    1.2.1 Javascript    1.2.2 帧    1.2.3 隐藏帧技术    1.2.4 动态HTML和DOM    1.2.5 iframe    1.2.6 XMLHttp   1.3 真正的Ajax   1.4 Ajax原则   1.5 Ajax后面的技术   1.6 谁在使用Ajax?    1.6.1 Google Suggest    1.6.2 Gmail    1.6.3 Google Maps    1.6.4 A9    1.6.5 Yahoo!News    1.6.6 Bitflux...
Effective MySQL之备份与恢复_数据库教程
数据库教程

Effective MySQL之备份与恢复_数据库教程

资源名称:Effective MySQL之备份与恢复  内容简介: mysql资深专家ronald bradford撰写的精品书籍《effective mysql之备份与恢复》涵盖了所有能够确保开发合理备份和恢复计划的选项,并对各选项做了详细说明,给出了语法示例。本书对照讲解不同的备份和恢复策略,将帮助您防止mysql数据因范围广泛的各种灾难受到损坏。 主要内容: 理解不同备份策略如何影响锁定和系统可用性; 了解静态备份选项和时间点要求的重要性; 体会使用mysql replication实现不同备份策略的优势; 了解云计算中mysql方案的好处与风险; 确定对最优数据保护需求具有决定性影响的重要业务因素; 识别影响数据持久性和性能的重要配置变量; 发现潜在灾难类型并制定可靠对策; 使用压缩、流、增量和并行选项来优化备份方法 ; 资源目录: 第1章 五分钟成为一名dba 1 1.1 mysql备份 2 1.1.1 确定数据库的大小 3 1.1.2 选择锁策略 4 1.1.3 运行时间 5 1.1.4 组合信息 6 1.2 执行mysql备份 6 1.2.1 运行mysqldump 7 1.2.2 安全地备份 9 1.2.3...
数据整理实践指南_数据库教程
数据库教程

数据整理实践指南_数据库教程

资源名称:数据整理实践指南  内容简介: 随着数据科学的热门,数据的优化、整理以及如何处理不良数据成为人们关注的重点。本书通过处理不良数据,进行数据清理的案例,向读者展示了处理数据的方法。 本书共有19章,从6部分向读者展示了使用和清理不良数据背后的理论和实践。第1部分是Grubby的动手实践指南,它向读者介绍了驾驭、提取数据的方法,如何处理文本数据中的数据以及Web开发中碰到的数据问题。第2部分是让人充满意外的数据,它向读者介绍了数据也会“撒谎”。第3部分是方法,它向读者介绍了处理不良数据的一些方法。第4部分是数据存储和基础设施,它向读者介绍了如何存储数据。第5部分是数据的商业化,它向读者介绍了如何避免数据处理的一些误差。第6部分是数据策略,它向读者介绍了如何追踪数据、评估数据质量以及构建数据质量相关平台等。 本书适合数据科学家、数据处理和整理相关开发人员阅读。也适合想要进入数据处理领域的读者阅读。 作者简介: Q.Ethan McCallum,是一位顾问、作家,也是一名科技爱好者。他帮助很多公司在数据和技术方面做出明智的决策,他为The O’Relly Network 和Java.net撰写文章,并且为《C/C++Users Journal》《Doctor Dobb’s Journal》和《Linux Magazine》撰稿。 资源目录: 第1章 从头说起:什么是噪音数据 1 第2章 是我的问题还是数据的问题 4 2.1 理解数据结构 5 2.2 校验 8 2.2.1 字段校验 8 2.2.2 值校验 9 2.2.3 简单统计的物理解释 10 2.3 可视化 11 2.3.1 关键词竞价排名示例 13 2.3.2 搜索来源示例 18...