Python数据分析与挖掘实战 PDF_Python教程
Python教程

Python数据分析与挖掘实战 PDF_Python教程

资源名称:Python数据分析与挖掘实战 PDF 内容简介: 10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。 作者简介: 张良均 ,资深大数据挖掘专家和模式识别专家,高级信息项目管理师,有10多年的大数据挖掘应用、咨询和培训经验。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学、华南师范大学、华南农业大学、贵州师范学院、韩山师范学院、广东技术师范学院兼职教授,著有《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》《R语言数据分析与挖掘实战》等畅销书。 资源目录: 前言 基础篇 第1章 数据挖掘基础2 1.1 某知名连锁餐饮企业的困惑2 1.2 从餐饮服务到数据挖掘3 1.3 数据挖掘的基本任务4 1.4 数据挖掘建模过程4 1.4.1 定义挖掘目标4 1.4.2 数据取样5 1.4.3 数据探索6 1.4.4 数据预处理7 1.4.5 挖掘建模7 1.4.6 模型评价7 1.5 常用的数据挖掘建模工具7 1.6 小结9 第2章 Python数据分析简介10 2.1 搭建Python开发平台12 2.1.1 所要考虑的问题12 2.1.2 基础平台的搭建12 2.2 Python使用入门13 2.2.1 运行方式14 2.2.2 基本命令15 2.2.3 数据结构17 2.2.4 库的导入与添加20 2.3 Python数据分析工具22 2.3.1 Numpy23 2.3.2 Scipy24 2.3.3 Matplotlib24 2.3.4 Pandas26 2.3.5 StatsModels27 2.3.6 Scikit-Learn28 2.3.7 Keras29 2.3.8 Gensim30 2.4 配套资源使用设置31...
Python数据分析实战 PDF_Python教程
Python教程

Python数据分析实战 PDF_Python教程

资源名称:Python数据分析实战 PDF 内容简介: Python 简单易学,拥有丰富的库,并且具有极强的包容性。本书展示了如何利用Python 语言的强大功能,以最小的编程代价进行数据的提取、处理和分析,主要内容包括:数据分析和Python 的基本介绍,NumPy 库,pandas 库,如何使用pandas 读写和提取数据,用matplotlib 库和scikit-learn 库分别实现数据可视化和机器学习,以实例演示如何从原始数据获得信息、D3 库嵌入和手写体数字的识别。 作者简介: Fabio Nelli IRBM科学园IT科学应用专家,曾为IBM、EDS等企业提供咨询。目前正在开发Java应用,对接科学仪器和Oracle数据库,生成数据和Web服务器应用,为研究人员提供实时分析结果。他还是Meccanismo Complesso社区(www.meccanismocomplesso.org)的项目协调人。 译者简介: 杜春晓 英语语言文学学士,软件工程硕士。其他译著有《电子达人——我的第一本Raspberry Pi入门手册》和《Python数据挖掘入门与实践》。新浪微博:@宜_生。 资源目录: 第1章 数据分析简介  1 1.1 数据分析  1 1.2 数据分析师的知识范畴  2 1.2.1 计算机科学  2 1.2.2 数学和统计学  3 1.2.3 机器学习和人工智能  3 1.2.4 数据来源领域  3 1.3 理解数据的性质  4 1.3.1 数据到信息的转变  4 1.3.2 信息到知识的转变  4 1.3.3 数据的类型  4 1.4 数据分析过程  4 1.4.1 问题定义  5 1.4.2 数据抽取  6 1.4.3 数据准备  6 1.4.4 数据探索和可视化  7 1.4.5 预测模型  7 1.4.6 模型评估  8 1.4.7 部署  8 1.5 定量和定性数据分析  9 1.6 开放数据  9 1.7 Python和数据分析  11 1.8 结论  11...
Python机器学习实践指南_Python教程
Python教程

Python机器学习实践指南_Python教程

资源名称:Python机器学习实践指南 内容简介: 机器学习是近年来渐趋热门的一个领域,同时Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书结合了机器学习和Python 语言两个热门的领域,通过利用两种核心的机器学习算法来将Python 语言在数据分析方面的优势发挥到极致。 全书共有10 章。第1 章讲解了Python 机器学习的生态系统,剩余9 章介绍了众多与机器学习相关的算法,包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用。 本书适合Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业人员及科研人员阅读。 作者简介: Alexander T. Combs 是一位经验丰富的数据科学家、策略师和开发人员。他有金融数据抽取、自然语言处理和生成,以及定量和统计建模的背景。他目前是纽约沉浸式数据科学项目的一名全职资深讲师。 资源目录: 第1章Python机器学习的生态系统1 1.1数据科学/机器学习的工作流程2 1.1.1获取2 1.1.2检查和探索2 1.1.3清理和准备3 1.1.4建模3 1.1.5评估3 1.1.6部署3 1.2Python库和功能3 1.2.1获取4 1.2.2检查4 1.2.3准备20 1.2.4建模和评估26 1.2.5部署34 1.3设置机器学习的环境34 1.4小结34 第2章构建应用程序,发现低价的公寓35 2.1获取公寓房源数据36 使用import.io抓取房源数据36 2.2检查和准备数据38 2.2.1分析数据46 2.2.2可视化数据50 2.3对数据建模51 2.3.1预测54 2.3.2扩展模型57 2.4小结57...
Python地理空间分析指南(第2版)_Python教程
Python教程

Python地理空间分析指南(第2版)_Python教程

资源名称:Python地理空间分析指南(第2版) 内容简介: 用非常流行的Python语言做地理空间分析; 学习高效、易学的地理空间分析指南; 书中含有典型且非常实用的开发案例,帮助读者快速掌握相关技能; 图文结合,将学习效率大大提高。 Python作为一种高级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言之一。 本书以地理空间分析为背景,介绍了Python在地理信息处理方面的应用技巧。全书共分为10章,分别介绍了Python与地理空间分析、地理空间数据、地理空间技术、Python的地理空间分析工具、Python与地理信息系统、Python与遥感、Python与高程数据、Python与地理空间高级建模、实时数据、综合应用等内容。 本书内容结构清晰,示例完整,适合希望了解测绘数字化和分析的读者,也适合想使用Python进行空间地理分析、建模和GIS分析的开发人员及研究人员参考阅读。 作者简介: Joel Lawhead 目前是NVision公司的CIO,该公司是业内屡获殊荣的地理信息集成和传感工程服务提供商。他还获得了管理专业人员资格认证(Project Management Professional,PMP),地理信息专业资格认证(certified GIS Professional ,GISP)。 Joel于1997年开始使用Python,从2000年开始使用它进行地理空间软件的开发,也是Learning Geospatial Analysis with Python(第1版)和QGIS Python Programming Cookbook的作者,并且这两本书都是Packt出版的。他撰写的Python Cookbook系列图书由O'Reilly Media出版,其不同版本更是各具特色。除此之外,他还是广受赞誉的开源软件PyShp(Python Shapefile Library)的主要开发人员。他的技术博客是http://geospatialpython.com/,Twitter昵称是@SpatialPython,通过上述方式,用户可以和他讨论地理空间分析中与Python编程相关的话题。 2011年,Joel通过逆向工程处理了Shapefile文件的空间索引格式,帮助地理空间Python工程师Marc Pfister实现了上述索引算法,这一做法有利于世界各地的开发者开发出更易于集成、更健壮的地理空间应用。 Joel作为架构师、项目经理和地理空间应用合作开发者,多次为美国政府机构提供服务,其中包括NASA、FEMA、NOAA、美国海军,以及其他商业和非营利性机构。2002年,由于其领导开发的实时应急响应协作工具(the Real-Time Emergency Action Coordination Tool,REACT)表现杰出,他获得了Esri公司颁发的国际GIS特别成就奖。该软件的主要用途是使用地理空间分析技术进行应急管理。 资源目录: 第1章 Python与地理空间分析 1 1.1 地理空间分析与我们的生活 1 1.2 地理空间分析的历史 3 1.3 地理信息系统 6 1.4 遥感 7...
python设计模式 第2版 PDF_Python教程
Python教程

python设计模式 第2版 PDF_Python教程

资源名称:python设计模式 第2版 PDF  内容简介: 设计模式是构建大型软件系统最强大的方法之一,优化软件架构和设计已经逐渐成为软件开发和维护过程中的一个重要课题。 本书通过11章内容,全面揭示有关设计模式的内容,并结合Python语言进行示例化的解析。全书囊括单例设计模式、工厂模式、门面模式、代理模式、观察者模式、命令模式、模板方法模式、复合模式、状态设计模式以及反模式等多种设计模式。 本书适合那些关注软件设计原则,并想将优秀的设计模式应用到Python编程当中的读者阅读,也适合普通的软件工程师、架构师参考。 资源目录: 前言 第1章 设计模式简介 第2章 单例设计模式 第3章 工厂模式:建立创建对象的工厂 第4章 门面模式——与门面相适 第5章 代理模式——控制对象的访问 第6章 观察者模式——了解对象的情况 第7章 命令模式——封装调用 第8章 模板方法模式——封装算法 第9章 模型—视图—控制器——复合模式 第10章 状态设计模式 第11章 反模式 资源截图:
Python数据分析基础 PDF_Python教程
Python教程

Python数据分析基础 PDF_Python教程

资源名称:Python数据分析基础 PDF  内容简介: 想深入应用手中的数据?还是想在上千份文件上重复同样的分析过程?没有编程经验的非程序员们如何能在最短的时间内学会用当今炙手可热的Python语言进行数据分析? 来自Facebook的数据专家Clinton Brownley可以帮您解决上述问题。在他的这本书里,读者将能掌握基本Python编程方法,学会编写出处理电子表格和数据库中的数据的脚本,并了解使用Python模块来解析文件、分组数据和生成统计量的方法。 学习基础语法,创建并运行自己的Python脚本 读取和解析CSV文件 读取多个Excel工作表和工作簿 执行数据库操作 搜索特定记录、分组数据和解析文本文件 建立统计图并绘图 生成描述性统计量并估计回归模型和分类模型 在Windows和Mac环境下按计划自动运行脚本 作者简介: Clinton W. Brownley 博士,Facebook数据科学家,负责大数据流水线、统计建模和数据可视化项目,并为大型基础设施建设提供数据驱动的决策建议。 资源目录: 前言  xi 第1章 Python 基础  1 1.1 创建 Python 脚本  1 1.2 运行 Python 脚本  3 1.3 与命令行进行交互的几项技巧  6 1.4 Python 语言基础要素  10 1.4.1 数值  10 1.4.2 字符串  12 1.4.3 正则表达式与模式匹配  16 1.4.4 日期  19 1.4.5...
教孩子学编程 PYTHON语言版 PDF_Python教程
Python教程

教孩子学编程 PYTHON语言版 PDF_Python教程

资源名称:教孩子学编程 PYTHON语言版 PDF 资源目录: 第1章Python基础——认识环境1 1.1认识Python3 1.2用Python编写程序5 1.3运行Python程序5 1.4本章小结6 1.5编程挑战7 第2章海龟作图——用Python绘图9 2.1第一个海龟程序10 2.1.1程序是如何工作的10 2.1.2发生了什么12 2.2旋转的海龟13 2.3海龟画圆14 2.4添加颜色15 2.4.1一个四色螺旋线16 2.4.2修改背景颜色19 2.5一个变量搞定一切20 2.6本章小结22 2.7编程挑战22 第3章数字和变量——用Python做数学运算24 3.1变量——保存内容的地方25 3.2Python中的数字和数学运算26 3.2.1Python数字27 3.2.2Python操作符28 3.2.3在Pythonshell中进行数学运算28 3.2.4语法错误——你说什么?29 3.2.5Pythonshell中的变量30 3.2.6用操作符编程——披萨计算器31 3.3字符串——Python中真正的字符33 3.4用字符串改进彩色螺旋线35 3.5列表——将所有内容放到一起36 3.6Python做作业38 3.7本章小结40 3.8编程挑战41 第4章循环很有趣(你可以再说一遍)42 4.1构建自己的循环43 4.1.1使用for循环生成4个圆组成的玫瑰花瓣44 4.1.2修改循环让玫瑰花瓣带有6个圆46 4.2把玫瑰花瓣程序改进为允许用户输入48 4.3游戏循环和while循环50 4.4家庭成员螺旋线52 4.5整合——式的螺旋线55 4.6本章小结59...
Python机器学习 PDF_Python教程
Python教程

Python机器学习 PDF_Python教程

资源名称:Python机器学习 PDF   作者简介: Sebastian Raschka是密歇根州立大学的博士生,他在计算生物学领域提出了几种新的计算方法,还被科技博客Analytics Vidhya评为GitHub上具影响力的数据科学家。他有一整年都使用Python进行编程的经验,同时还多次参加数据科学应用与机器学习领域的研讨会。正是因为Sebastian 在数据科学、机器学习以及Python等领域拥有丰富的演讲和写作经验,他才有动力完成此书的撰写,目的是帮助那些不具备机器学习背景的人设计出由数据驱动的解决方案。他还积极参与到开源项目中,由他开发完成的计算方法已经被成功应用到了机器学习竞赛(如Kaggle等)中。在业余时间,他沉醉于构建体育运动的预测模型,要么待在电脑前,要么在运动。   资源目录:  译者序推荐序作者简介审校者简介前言第1章 赋予计算机学习数据的能力11.1构建智能机器将数据转化为知识11.2 机器学习的三种不同方法11.2.1 通过监督学习对未来事件进行预测21.2.2 通过强化学习解决交互式问题41.2.3 通过无监督学习发现数据本身潜在的结构41.2.4 基本术语及符号介绍51.3 构建机器学习系统的蓝图61.3.1 数据预处理61.3.2 选择预测模型类型并进行训练71.3.3 模型验证与使用未知数据进行预测81.4 Python在机器学习中的应用8本章小结9第2章 机器学习分类算法102.1 人造神经元—早期机器学习概览102.2 使用Python实现感知器学习算法132.3 自适应线性神经元及其学习的收敛性192.3.1 通过梯度下降最小化代价函数202.3.2 使用Python实现自适应线性神经元212.3.3 大规模机器学习与随机梯度下降25本章小结29第3章 使用scikit-learn实现机器学习分类算法303.1 分类算法的选择303.2 初涉scikit-learn的使用30使用scikit-learn训练感知器313.3 逻辑斯谛回归中的类别概率343.3.1 初识逻辑斯谛回归与条件概率343.3.2 通过逻辑斯谛回归模型的代价函数获得权重363.3.3 使用scikit-learn训练逻辑斯谛回归模型373.3.4 通过正则化解决过拟合问题393.4 使用支持向量机最大化分类间隔413.4.1 对分类间隔最大化的直观认识413.4.2 使用松弛变量解决非线性可分问题423.4.3 使用scikit-learn实现SVM443.5 使用核SVM解决非线性问题443.6 决策树483.6.1 最大化信息增益—获知尽可能准确的结果493.6.2 构建决策树523.6.3 通过随机森林将弱分类器集成为强分类器533.7...
Python高性能编程 PDF_Python教程
Python教程

Python高性能编程 PDF_Python教程

资源名称:Python高性能编程 PDF 内容简介: 本书共有12章,围绕如何进行代码优化和加快实际应用的运行速度进行详细讲解。本书主要包含以下主题:计算机内部结构的背景知识、列表和元组、字典和集合、迭代器和生成器、矩阵和矢量计算、并发、集群和工作队列等。最后,通过一系列真实案例展现了在应用场景中需要注意的问题。本书适合初级和中级Python程序员、有一定Python语言基础想要得到进阶和提高的读者阅读。 作者简介: Micha Gorelick在bitly公司从事与数据打交道的工作,并负责建立了快速前进实验室(Fast Forward Labs),研究从机器学习到高性能流算法领域的问题。Ian Ozsvald是ModelInsight.io的数据科学家和教师,有着超过十年的Python经验。他在PyCon和PyData会议上教授Python编程,这几年一直在英国从事关于数据科学和高性能计算方面的咨询工作。 资源目录: 第1章 理解高性能Python 11.1 基本的计算机系统 11.1.1 计算单元 21.1.2 存储单元 51.1.3 通信层 61.2 将基本的元素组装到一起 81.3 为什么使用Python 12第2章 通过性能分析找到瓶颈 152.1 高效地分析性能 162.2 Julia集合的介绍 172.3 计算完整的Julia集合 202.4 计时的简单方法——打印和修饰 242.5 用UNIX的time命令进行简单的计时 272.6 使用cProfile模块 282.7 用runsnakerun对cProfile的输出进行可视化 332.8 用line_profiler进行逐行分析 342.9 用memory_profiler诊断内存的用量 392.10...