资源名称:数据分析技术 使用SQL和EXCEL工具 第2版
内容简介:
SQL是数据查询的基本语言,Excel是数据分析和展示的最常见工具。两者结合,可以组成一个强大且易于理解的业务数据分析工具。很多类重要的数据分析并不需要复杂且昂贵的数据挖掘工具。答案就在你的电脑桌上。
这是一本实用指南,作者Gordon S. Linoff是数据挖掘领域的权威专家。书中介绍了如何使用SQL和Excel来设计并完成复杂的数据分析。本书的第1版被广泛认可,第2版涵盖了对SQL和Excel新功能的介绍,同时包括新的技术和实际业务示例。第2版介绍了业务经理和数据分析人员所需掌握的最新信息。
《数据分析技术 使用SQL和Excel工具》首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,本书介绍了核心分析技术。本书内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现。
随着对本书的阅读,你会发现很多知识点,包括地理信息的重要性,图表中的数据随时间的变化方式,如何使用生存分析理解客户任期和变动,以及影响生存率的因素。同时,还会探索到一些方法,包括分析客户的购买模式、分析购物车以及计算关联规则。此外,本书还包含重要的SQL数据挖掘模型(线性回归模型、朴素贝叶斯模型等)、建立客户签名所需的信息、用于分析结果集的模型、包含累积增量图表和ROC图表、使用SQL的最佳实践、提高查询性能的方法等。
资源目录:
第1章 数据挖掘者眼中的SQL 1
第2章 表中有什么?开始数据探索 39
第3章 不同之处是如何不同? 79
第4章 发生的地点在何处? 119
第5章 关于时间 161
第6章 客户的持续时间有多久?使用生存分析理解客户和他们的价值 209
第7章 影响生存率的因素:客户任期 261
第8章 多次购买以及其他重复事件 303
第9章 购物车里有什么?购物车分析 349
第10章 关联规则 387
第11章 SQL数据挖掘模型 423
第12章 最佳拟合线:线性回归模型 467
第13章 为进一步分析数据创建客户签名 505
第14章 性能问题:高效使用SQL 543
附录 数据库之间的等价结构 583
资源截图: