Python中文网

Python数据分析 第2版

cnpython645

推荐编程书籍:Python数据分析 第2版,由人民邮电出版社2018-06-01月出版发行,本书编译以及作者信息 为:[美] 阿曼多·凡丹戈(Armando Fandango) 著,韩波 译,此次为第2次发行, 国际标准书号为:9787115481177,品牌为异步图书, 这本书采用平装开本为16开,纸张采为胶版纸,全书共有274页字数万字,是本Python 编程相关非常不错的书。

此书内容摘要

Python作为一种程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。
本书就是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组和Pandas入门开始,陆续介绍了数据的检索、数据加工与存储、数据可视化等内容。同时,本书还介绍了信号处理与时间序列、应用数据库、分析文本数据与社交媒体、预测性分析与机器学习、Python生态系统的外部环境和云计算、性能优化及分析、并发性等内容。在本书的最后,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。
本书延续了上一版示例丰富、简单易懂的优点,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。

关于此书作者

Armando Fandango是Epic工程咨询集团知名数据科学家,负责与国防和政府机构有关的保密项目。Armando是一位技术精湛的技术人员,拥有全球创业公司和大型公司的工作经历和管理经验。他的工作涉及金融科技、证券交易所、银行、生物信息学、基因组学、广告技术、基础设施、交通运输、能源、人力资源和娱乐等多个领域。
Armando在预测分析、数据科学、机器学习、大数据、产品工程、高性能计算和云基础设施等项目中工作了十多年。他的研究兴趣横跨机器学习、深度学习和科学计算等领域。

编辑们的推荐

Python拥有许多强大的程序库,已经成为进行各种数据分析和预测建模任务的流行平台。Python的应用范围很广,拓展性很大。本书介绍了众多的Python模块,例如Matplotlib、statsmodels、scikit-learn和NLTK。同时,本书还介绍了Python如何与外部环境(例如R、Fortran、C/C++和Boost库)进行交互。
通过阅读本书,你将学会如何使用Python处理和操作数据,并完成复杂的分析和建模。我们将借助NumPy和Pandas来学习数据的各种操作。本书将介绍如何从各种数据源(例如SQL、NoSQL、CSV文件和HDF5)中存储和检索数据。此外,我们还将学习如何通过可视化库实现数据的可视化,以及信号处理、时间序列、文本数据分析、机器学习和社交媒体分析等主题。

Python数据分析 第2版图书的目录

第 1章Python程序库入门 1
1.1安装Python 33
1.1.1安装数据分析程序库3
1.1.2Linux平台或Mac OS X平台3
1.1.3Windows平台4
1.2将IPython用作shell4
1.3学习手册页6
1.4Jupyter Notebook7
1.5NumPy数组8
1.6一个简单的应用8
1.7从何处寻求帮助和参考资料11
1.8查看Python库中包含的模块12
1.9通过Matplotlib实现数据的可视化12
1.10小结14
第2章 NumPy数组15
2.1NumPy数组对象16
2.2创建多维数组17
2.3选择NumPy数组元素17
2.4NumPy的数值类型18
2.4.1数据类型对象20
2.4.2字符码20
2.4.3dtype构造函数21
2.4.4dtype属性22
2.5一维数组的切片与索引23
2.6处理数组形状23
2.6.1堆叠数组25
2.6.2拆分NumPy数组28
2.6.3NumPy数组的属性30
2.6.4数组的转换34
2.7创建数组的视图和拷贝35
2.8花式索引36
2.9基于位置列表的索引方法38
2.10用布尔型变量索引NumPy数组39
2.11NumPy数组的广播41
2.12小结44
2.13参考资料44
第3章Pandas入门45
3.1Pandas的安装与概览46
3.2Pandas数据结构之DataFrame47
3.3Pandas数据结构之Series49
3.4利用Pandas查询数据52
3.5利用Pandas的DataFrame进行统计计算56
3.6利用Pandas的DataFrame实现
数据聚合58
3.7DataFrame的串联与附加
操作62
3.8连接DataFrames63
3.9处理缺失数据问题65
3.10处理日期数据67
3.11数据透视表70
3.12小结71
3.13参考资料71
第4章统计学与线性代数72
4.1用NumPy进行简单的描述性统计计算72
4.2用NumPy进行线性代数运算75
4.2.1用NumPy求矩阵的逆75
4.2.2用NumPy解线性方程组77
4.3用NumPy计算特征值和特征向量78
4.4NumPy随机数80
4.4.1用二项式分布进行博弈81
4.4.2正态分布采样83
4.4.3用SciPy进行正态检验84
4.5创建掩码式NumPy数组86
4.6忽略负值和极值88
4.7小结91
第5章数据的检索、加工与存储92
5.1利用NumPy和pandas对CSV文件进行写操作92
5.2二进制.npy与pickle格式94
5.3使用PyTables存储数据97
5.4Pandas DataFrame与HDF5仓库之间的读写操作99
5.5使用Pandas读写Excel文件102
5.6使用REST Web服务和JSON103
5.7使用Pandas读写JSON105
5.8解析RSS和Atom订阅106
5.9使用Beautiful Soup解析HTML108
5.10小结114
5.11参考资料114
第6章数据可视化115
6.1Matplotlib的子库116
6.2Matplotlib绘图入门116
6.3对数图118
6.4散点图119
6.5图例和注解121
6.6三维图123
6.7Pandas绘图125
6.8时滞图127
6.9自相关图129
6.10Plot.ly130
6.11小结132
第7章信号处理与时间序列133
7.1statsmodels模块134
7.2移动平均值134
7.3窗口函数136
7.4协整的定义138
7.5自相关140
7.6自回归模型142
7.7ARMA模型145
7.8生成周期信号147
7.9傅里叶分析149
7.10谱分析152
7.11滤波153
7.12小结155
第8章应用数据库156
8.1基于sqlite3的轻量级访问157
8.2通过Pandas访问数据库159
8.3SQLAlchemy161
8.3.1SQLAlchemy的安装和配置161
8.3.2通过SQLAlchemy填充数据库162
8.3.3通过SQLAlchemy查询数据库164
8.4Pony ORM166
8.5Dataset:懒人数据库167
8.6PyMongo与MongoDB168
8.7利用Redis存储数据170
8.8利用memcache存储数据171
8.9Apache Cassandra172
8.10小结174
第9章分析文本数据和社交媒体176
9.1安装NLTK177
9.2NLTK简介177
9.3滤除停用字、姓名和数字178
9.4词袋模型180
9.5词频分析181
9.6朴素贝叶斯分类183
9.7情感分析186
9.8创建词云189
9.9社交网络分析193
9.10小结195
第10章 预测性分析与机器学习197
10.1预处理198
10.2基于逻辑回归的分类201
10.3基于支持向量机的分类202
10.4基于ElasticNetCV的回归分析205
10.5支持向量回归207
10.6基于相似性传播算法的聚类
分析210
10.7均值漂移算法211
10.8遗传算法213
10.9神经网络217
10.10决策树219
10.11小结222
第11章 Python生态系统的外部环境和云计算223
11.1与MATLAB/Octave交换
信息224
11.2安装rpy2225
11.3连接R225
11.4为Java传递NumPy数组228
11.5集成SWIG和NumPy229
11.6集成Boost和Python233
11.7通过f2py使用Fortran代码235
11.8PythonAnywhere云236
11.9小结238
第12章 性能优化、性能分析与并发性239
12.1代码的性能分析240
12.2安装Cython245
12.3调用C代码248
12.4利用multiprocessing创建进程池252
12.5通过Joblib提高for循环的并发性254
12.6比较Bottleneck函数与NumPy函数255
12.7通过Jug实现MapReduce257
12.8安装MPI for Python259
12.9IPython Parallel260
12.10小结263
附录A重要概念264
附录B常用函数269

部分内容试读

暂无.

关于此书评价

暂无.

书摘内容

暂无.

Python数据分析 第2版最新最全的试读、书评、目录、简介信息由Python中文网整理提供。

上一篇:没有了

下一篇:Python与量化投资:从基础到实战