Python中文网

Python3智能数据分析快速入门

cnpython706

Python3智能数据分析快速入门这本书,是由机械工业出版社在2019-07-01月出版的,本书著作者是 李明江,张良均,周东平,张尚佳 著,此次本版是第1次印刷发行, 国际标准书号(ISBN):9787111628057,品牌为机工出版, 这本书的包装是16开平装,所用纸张为胶版纸,全书共有500页字数万字, 是一本非常不错的Python编程书籍。

此书内容摘要

本书从逻辑上可分为两大部分。

第一部分是Python编程基础(第1~4章),介绍了Python环境搭建、Python基础语法、控制语句、函数、面向对象编程等。第1章旨在让读者从全局把握Python,了解利用Python进行智能数据分析的优势,并详细介绍了Python环境搭建与配置,同时还对两个常用集成开发环境做了详细介绍。第2章先对Python固定语法做了介绍,包括编码声明、注释、缩进等;而后介绍了Python常见的数据类型,包括str、list、tuple、dict、set等;还介绍了Python常用运算符,包括算术运算符、逻辑运算符、成员运算符、位运算符等。第3章主要对控制语句做了详细介绍,包括条件语句和循环语句,同时还介绍了和条件语句类似的异常处理try-except-else语句。第4章主要介绍了Python的内置函数、自定义函数、面向对象编程以及第三方库的安装与使用方法。

第二部分是数据分析编程(第5~9章),主要对数据分析中常用的第三方库做了详细介绍,强调在Python中对应函数的使用方法及其结果的解释说明。内容涵盖数值分析库NumPy,数据处理库pandas,绘图库Matplotlib、Seaborn、Bokeh,机器学习与数据分析建模库scikit-learn。这一部分涉及数据读取、数据预处理、模型构建、模型评价、结果可视化,几乎涵盖了整个数据分析过程,充分而又详细地说明了Python数据分析的常用操作,相信在本书的指导下,读者能够从零开始快速数据入门分析。

关于此书作者

李明江资深大数据专家,贵州省计算机学会常务理事,黔南州大数据专家委员会委员,黔南州计算机学会会长,黔南州教育信息化建设专家库专家,黔南民族师范学院计算机与信息学院院长,全国高校大数据教育联盟理事。主持过多项省厅级科研项目,并在《计算机应用研究》《科技通报》上发表过多篇大数据分析与数据挖掘相关技术的研究论文,著有《数据挖掘的应用与实践:案例与探析》《计算机网络技术与应用》等。


张良均资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验,擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析,对机器学习等AI技术驱动的数据分析也有深入研究。为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。华南师范大学、中南财经政法大学、广东工业大学、西安理工大学、广西科技大学、重庆交通大学、桂林电子科技大学等校外硕导。撰写了《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》《数据挖掘:实用案例分析》《Hadoop大数据分析与挖掘实战》等多部畅销书,累计销量近20万册。

编辑们的推荐

智能数据分析技术已经成为大数据时代重要的技能之一,它能帮助企业用户在合理时间内攫取、管理、处理、整理海量数据,为企业经营决策提供积极帮助。目前智能数据分析技术已经广泛应用于物联网、云计算、移动互联网等战略性新兴产业,商业价值逐渐显现出来,有实践经验的智能数据分析人才被各企业争抢。

Python编程的技术门槛虽然不高,但是包含的知识点比较多;AI技术不仅学习门槛高,而且知识点纷繁复杂。本书假设你有一定的数据分析基础,但是没有Python和AI基础,为了帮助你快速掌握智能数据分析需要的技术和方法,书中有针对性地讲解了Python和AI中必须要掌握的知识点,内容由浅入深,循序渐进。从环境配置、基本语法、基础函数到第三方库的安装与使用,对各个操作步骤、函数、工具、代码示例等的讲解非常详尽,确保所有满足条件的读者都能快速入门。

Python3智能数据分析快速入门图书的目录

目录

前言

第1章Python概述 1

1.1Python语言介绍 1

1.1.1Python的发展史 1

1.1.2Python特性 2

1.1.3Python应用领域 3

1.1.4Python机器学习优势 6

1.2Python环境配置 8

1.2.1Python 2还是Python 3 8

1.2.2Anaconda简介 8

1.2.3安装Anaconda 3 9

1.3Python的解释器与IDE 12

1.3.1Python的解释器 13

1.3.2Python各IDE比较 13

1.3.3PyCharm的安装与使用 16

1.3.4Jupyter Notebook的使用 26

小结 32

课后习题 33

第2章Python基础知识 34

2.1固定语法 34

2.1.1声明与注释 34

2.1.2缩进与多行语句 36

2.1.3保留字符与赋值 38

2.2运算符 40

2.2.1算术运算符 40

2.2.2赋值运算符 41

2.2.3比较运算符 43

2.2.4逻辑运算符 44

2.2.5按位运算符 44

2.2.6身份运算符 45

2.2.7成员运算符 46

2.2.8运算符优先级 47

2.3数据类型 48

2.3.1基础数据类型 48

2.3.2复合数据类型 55

2.4Python I/O 63

2.4.1input与print 64

2.4.2文件I/O 67

小结 70

课后习题 70

第3章控制语句 72

3.1条件语句 72

3.1.1if、elif与else 73

3.1.2try、except与else 76

3.2循环语句 80

3.2.1for 81

3.2.2while 83

3.2.3break、continue与pass 85

3.2.4列表推导式 89

小结 91

课后习题 91

第4章函数与对象 94

4.1函数 94

4.1.1内置函数 94

4.1.2自定义函数 101

4.1.3匿名函数 107

4.2对象 109

4.2.1面向对象简介 109

4.2.2属性与方法 110

4.2.3装饰器 116

4.2.4继承和多态 119

4.3Python常用库安装 126

4.3.1第三方库安装 126

4.3.2第三方库导入 130

4.3.3第三方库创建 131

小结 132

课后习题 133

第5章NumPy数值计算 135

5.1ndarray创建与索引 135

5.1.1创建ndarray对象 135

5.1.2ndarray的索引与切片 142

5.2ndarray的基础操作 145

5.2.1变换ndarray的形态 145

5.2.2排序与搜索 151

5.2.3字符串操作 156

5.3ufunc 159

5.3.1ufunc的广播机制 159

5.3.2常用ufunc 160

5.4matrix与线性代数 169

5.4.1创建NumPy矩阵 169

5.4.2矩阵的属性和基本运算 170

5.4.3线性代数运算 172

5.5NumPy文件读写 175

5.5.1二进制文件读写 175

5.5.2文件列表形式数据读写 178

小结 180

课后习题 180

第6章pandas基础 182

6.1pandas常用类 182

6.1.1Series 182

6.1.2DataFrame 187

6.1.3Index 191

6.2DataFrame基础操作 193

6.2.1索引 193

6.2.2排序 201

6.2.3合并 204

6.3其他数据类型操作 210

6.3.1时间操作 210

6.3.2文本操作 220

6.3.3category操作 223

小结 227

课后习题 227


部分内容试读

为什么要写这本书

2017年7月,国务院下达了关于印发《新一代人工智能发展规划》的通知。通知明确指出要加快培养聚集人工智能高端人才,把高端人才队伍建设作为人工智能发展的重中之重。而后,2018年12月,普华永道发布了《人工智能和相关技术对中国就业的净影响》,报告预测,人工智能及相关技术在未来20年将取代中国现有约26%的工作岗位,高于对英国20%的预估,但也能通过提升生产率和实际收入水平在中国创造出大量的新的工作机会。根据普华永道估计,人工智能对中国就业的净影响可能将创造约12%的净增岗位,相当于未来20年内增加约9000万个就业岗位。那么如何才能够赶上人工智能的浪潮呢?

人工智能是一门综合了计算机科学、生理学、哲学的交叉学科。凡是使用机器替代人类实现认知、识别、分析、决策等功能,均可认为使用了人工智能技术。按照技术分支,可以将人工智能分为问题求解,知识、推理与规划,学习,通信、感知与行动四个大方向。其中学习即机器学习,与智能数据分析紧密相关。

跟国外相比,我国智能数据分析在零售、银行、保险、证券等行业中的应用并不太理想。但随着市场竞争的加剧,各行业对智能数据分析技术的意愿越来越强烈,可以预计,未来几年各行业的数据分析应用一定会从传统的统计分析发展到智能数据分析应用。在大数据时代,数据过剩、人才短缺,智能数据分析专业人才的培养又需要专业知识和职业经验积累。所以,本书在编程知识的基础之上,大篇幅地描写了智能分析常备知识,希望能为智能数据分析人才的培养提供参考。

总的来说,随着云时代的来临,智能数据分析技术将具有越来越重要的战略意义。大数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产要素,人们对于海量数据的运用将预示着新一轮生产率增长和消费者盈余浪潮的到来。智能数据分析技术将帮助企业用户在合理时间内攫取、管理、处理、整理海量数据,为企业经营决策提供积极的帮助。智能数据分析作为数据存储和挖掘分析的前沿技术,已广泛应用于物联网、云计算、移动互联网等战略性新兴产业。虽然智能数据分析目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的智能数据分析人才更是成为各企业争夺的热门。为了满足日益增长的智能数据分析人才需求,很多大学开始尝试开设不同程度的智能数据分析课程。“智能数据分析”作为大数据时代的核心技术,必将成为高校数学与统计学专业的重要课程之一。

本书特色

本书作者从实践出发,总结了智能数据分析常用的方法,深入浅出地介绍了智能数据分析编程过程中的相关知识。书中涵盖Python环境搭建、Python基础语法、控制语句、函数、面向对象编程、数值计算、数据处理、绘图、模型构建等内容,还配套提供了程序代码及数据。此外,每章的最后均提供课后习题,帮助读者快速掌握Python的使用方法。

为了帮助读者更好地使用本书,泰迪云课堂(https://edu.tipdm.org)提供了配套的教学视频。对于本书配套的原始数据文件、Python程序代码,均可以通过关注泰迪学社微信公众号(TipDataMining),回复“图书资源”进行获取。为方便教师授课,本书还提供了PPT课件、教学大纲、教学进度表和教案等教学资源,教师可在泰迪学社微信公众号回复“教学资源”进行获取。

本书适用对象

开设有数据分析课程的高校的教师和学生。

目前国内不少高校将数据分析引入本科教学中,在数学、计算机、自动化、电子信息、金融等专业开设了数据分析技术相关的课程,但目前这一课程使用的教学工具仍然为SPSS、SAS等传统统计工具,并没有使用Python作为教学工具。本书提供了Python语言相关的从安装到使用的一系列知识,将有效指导高校教师和学生使用Python作为数据分析的工具之一。

数据分析开发人员。

数据分析开发人员的主要工作是将数据分析相关的算法应用于实际业务系统。本书提供了详细的机器学习与数据分析算法接口的用法与说明,能够帮助此类人员快速且有效地建立起数据分析应用的算法框架,帮助其迅速完成开发。

进行数据分析应用研究的科研人员。

许多科研院所为了更好地对科研工作进行管理,纷纷开发了适应自身特点的科研业务管理系统,并在使用过程中积累了大量的科研信息数据。但是,这些科研业务管理系统一般没有对这些数据进行深入分析,对数据所隐藏的价值并没有充分分析利用。科研人员需要数据分析工具及有关方法论来深挖科研信息的价值,从而提高科研水平。

关注高级数据分析的人员。

Python作为广泛应用于数据分析领域的编程语言,能为数据分析人员提供快速的、可靠的分析依据。本书提供全面的Python智能数据分析知识,能够指导这类人员快速入门数据分析,完成指定的数据分析任务。

如何阅读本书

本书从逻辑上可分为两大部分。

第一部分是Python编程基础(第1~4章),介绍了Python环境搭建、Python基础语法、控制语句、函数、面向对象编程等。第1章旨在让读者从全局把握Python,了解利用Python进行智能数据分析的优势,并详细介绍了Python环境搭建与配置,同时还对两个常用集成开发环境做了详细介绍。第2章先对Python固定语法做了介绍,包括编码声明、注释、缩进等;而后介绍了Python常见的数据类型,包括str、list、tuple、dict、set等;还介绍了Python常用运算符,包括算术运算符、逻辑运算符、成员运算符、位运算符等。第3章主要对控制语句做了详细介绍,包括条件语句和循环语句,同时还介绍了和条件语句类似的异常处理try-except-else语句。第4章主要介绍了Python的内置函数、自定义函数、面向对象编程以及第三方库的安装与使用方法。

第二部分是数据分析编程(第5~9章),主要对数据分析中常用的第三方库做了详细介绍,强调在Python中对应函数的使用方法及其结果的解释说明。内容涵盖数值分析库NumPy,数据处理库pandas,绘图库Matplotlib、Seaborn、Bokeh,机器学习与数据分析建模库scikit-learn。这一部分涉及数据读取、数据预处理、模型构建、模型评价、结果可视化,几乎涵盖了整个数据分析过程,充分而又详细地说明了Python数据分析的常用操作,相信在本书的指导下,读者能够从零开始快速数据入门分析。

勘误和支持

我们已经尽最大努力避免在文本和代码中出现错误,但是由于水平有限,编写时间仓促,书中难免出现一些疏漏和不足的地方。如果你有更多宝贵意见,欢迎在泰迪学社微信公众号回复“图书反馈”进行反馈。更多本系列图书的信息可以在“泰迪杯”数据挖掘挑战赛网站查阅。

张良均

2019年于广州

关于此书评价

暂无.

书摘内容

暂无.

Python3智能数据分析快速入门最新最全的试读、书评、目录、简介信息由Python中文网整理提供。