Python中文网

Python数据科学指南

cnpython567

Python数据科学指南这本书,是由人民邮电出版社在2016-11-01月出版的,本书著作者是 印度,Gopi,Subramanian,萨伯拉曼尼安 著,方延风,刘丹 译,此次本版是第1次印刷发行, 国际标准书号(ISBN):9787115435101,品牌为异步图书, 这本书的包装是16开平装,所用纸张为胶版纸,全书共有380页字数万字, 是一本非常不错的Python编程书籍。

此书内容摘要

Python作为一种高级程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言,并成为数据科学家的必读之一。
本书详细介绍了Python在数据科学中的应用,包括数据探索、数据分析与挖掘、机器学习、大规模机器学习等主题。每一章都为读者提供了足够的数学知识和代码示例来理解不同深度的算法功能,帮助读者更好地掌握各个知识点。
本书内容结构清晰,示例完整,无论是数据科学领域的新手,还是经验丰富的数据科学家都将从中获益。

关于此书作者

Gopi Subramanian是一名数据科学家,他在数据挖掘与机器学习领域有着超过15年经验。在过去的10年中,他设计、构思、开发并领导了数据挖掘、文本挖掘、自然语言处理、信息提取和检索等多个项目,涉及不同领域和商务垂直系统。他在美国和印度的专利局共计申请了10多项专利,并以自己的名义出版了许多书籍。

编辑们的推荐

本书从讲解如何在数据科学中应用Python开始,陆续介绍了Python的工作环境,如何用Python分析数据,以及数据挖掘的概念,然后又扩展到机器学习。本书还涵盖了缩减原则、集成方法、随机森林、旋转森林和超树等方面的内容,这些都是一个成功的数据科学专家所必需掌握的。
阅读本书,你将学会:
■ 揭示数据科学算法的完整范畴;
■ 高效地掌握和使用numpy、scipy、scikit-learn和matplotlib等Python库;
■ 了解进阶回归方法的建模和变量选择;
■ 进一步彻底理解集成方法的潜在含义及实施;
■ 在各种各样的数值和文本数据集上解决实际问题;
■ 熟悉先进的算法,如梯度提升、随机森林、旋转森林等。
本书特色:
■ 内容明确且易于跟学;
■ 甄选重要的任务与问题;
■ 精心组织编排内容,有效解决问题;
■ 清晰易懂的讲解方式;
■ 书中呈现的解决方案能够直接应用到实际问题中。

Python数据科学指南图书的目录

目录

第1章 Python在数据科学中的应用 1
1.1简介2
1.2使用字典对象2
1.2.1准备工作2
1.2.2操作方法2
1.2.3工作原理3
1.2.4更多内容4
1.2.5参考资料6
1.3使用字典的字典6
1.3.1准备工作6
1.3.2操作方法6
1.3.3工作原理7
1.3.4参考资料7
1.4使用元组7
1.4.1准备工作7
1.4.2操作方法8
1.4.3工作原理9
1.4.4更多内容12
1.4.5参考资料12
1.5使用集合13
1.5.1准备工作13
1.5.2操作方法13
1.5.3工作原理14
1.5.4更多内容15
1.6写一个列表16
1.6.1准备工作16
1.6.2操作方法16
1.6.3工作原理18
1.6.4更多内容19
1.7从另一个列表创建列表——列表推导20
1.7.1准备工作20
1.7.2操作方法20
1.7.3工作原理20
1.7.4更多内容21
1.8使用迭代器22
1.8.1准备工作22
1.8.2操作方法23
1.8.3工作原理23
1.8.4更多内容24
1.9生成一个迭代器和生成器24
1.9.1准备工作25
1.9.2操作方法25
1.9.3工作原理25
1.9.4更多内容25
1.10使用可迭代对象26
1.10.1准备工作26
1.10.2操作方法26
1.10.3工作原理27
1.10.4参考资料27
1.11将函数作为变量传递28
1.11.1准备工作28
1.11.2操作方法28
1.11.3工作原理28
1.12在函数中嵌入函数28
1.12.1准备工作29
1.12.2操作方法29
1.12.3工作原理29
1.13将函数作为参数传递29
1.13.1准备工作29
1.13.2操作方法29
1.13.3工作原理30
1.14返回一个函数30
1.14.1准备工作31
1.14.2操作方法31
1.14.3工作原理31
1.14.4更多内容32
1.15使用装饰器改变函数行为32
1.15.1准备工作32
1.15.2操作方法32
1.15.3工作原理33
1.16使用lambda创造匿名函数34
1.16.1准备工作34
1.16.2操作方法35
1.16.3工作原理35
1.17使用映射函数35
1.17.1准备工作36
1.17.2操作方法36
1.17.3工作原理36
1.17.4更多内容36
1.18使用过滤器37
1.18.1准备工作37
1.18.2操作方法37
1.18.3工作原理38
1.19使用zip和izip函数38
1.19.1准备工作38
1.19.2操作方法38
1.19.3工作原理38
1.19.4更多内容39
1.19.5参考资料40
1.20从表格数据使用数组40
1.20.1准备工作40
1.20.2操作方法41
1.20.3工作原理41
1.20.4更多内容42
1.21对列进行预处理43
1.21.1准备工作44
1.21.2操作方法44
1.21.3工作原理45
1.21.4更多内容45
1.22列表排序46
1.22.1准备工作46
1.22.2操作方法46
1.22.3工作原理46
1.22.4更多内容47
1.23采用键排序47
1.23.1准备工作48
1.23.2操作方法48
1.23.3工作原理49
1.23.4更多内容49
1.24使用itertools52
1.24.1准备工作52
1.24.2操作方法52
1.24.3工作原理53
第2章Python环境55
2.1简介55
2.2使用NumPy库55
2.2.1准备工作55
2.2.2操作方法56
2.2.3工作原理58
2.2.4更多内容64
2.2.5参考资料64
2.3使用matplotlib进行绘画64
2.3.1准备工作64
2.3.2操作方法64
2.3.3工作原理66
2.3.4更多内容72
2.4使用scikit-learn进行机器学习73
2.4.1准备工作73
2.4.2操作方法73
2.4.3工作原理75
2.4.4更多内容81
2.4.5参考资料82
第3章数据分析——探索与争鸣83
3.1简介84
3.2用图表分析单变量数据85
3.2.1准备工作85
3.2.2操作方法86
3.2.3工作原理87
3.2.4参考资料92
3.3数据分组和使用点阵图92
3.3.1准备工作93
3.3.2操作方法93
3.3.3工作原理95
3.3.4参考资料97
3.4为多变量数据绘制散点阵图97
3.4.1准备工作98
3.4.2操作方法98
3.4.3工作原理99
3.4.4参考资料100
3.5使用热图101
3.5.1准备工作101
3.5.2操作方法101
3.5.3工作原理102
3.5.4更多内容104
3.5.5参考资料105
3.6实施概要统计及绘图105
3.6.1准备工作105
3.6.2操作方法106
3.6.3工作原理107
3.6.4参考资料110
3.7使用箱须图110
3.7.1准备工作110
3.7.2操作方法110
3.7.3工作原理111
3.7.4更多内容112
3.8修补数据113
3.8.1准备工作113
3.8.2操作方法113
3.8.3工作原理114
3.8.4更多内容115
3.8.5参考资料116
3.9实施随机采样116
3.9.1准备工作116
3.9.2操作方法117
3.9.3工作原理117
3.9.4更多内容118
3.10缩放数据118
3.10.1准备工作118
3.10.2操作方法118
3.10.3工作原理119
3.10.4更多内容119
3.11数据标准化121
3.11.1准备工作121
3.11.2操作方法121
3.11.3工作原理122
3.11.4更多内容122
3.12实施分词化123
3.12.1准备工作123
3.12.2操作方法123
3.12.3工作原理124
3.12.4更多内容125
3.12.5参考资料127
3.13删除停用词127
3.13.1操作方法128
3.13.2工作原理129
3.13.3更多内容130
3.13.4参考资料130
3.14词提取130
3.14.1准备工作131
3.14.2操作方法132
3.14.3工作原理132
3.14.4更多内容133
3.14.5参考资料133
3.15执行词形还原134
3.15.1准备工作134
3.15.2操作方法134
3.15.3工作原理135
3.15.4更多内容135
3.15.5参考资料135
3.16词袋模型表示文本136
3.16.1准备工作136
3.16.2操作方法136
3.16.3工作原理138
3.16.4更多内容140
3.16.5参考资料141
3.17计算词频和反文档频率142
3.17.1准备工作142
3.17.2操作方法142
3.17.3工作原理144
3.17.4更多内容145
第4章数据分析——深入理解146
4.1简介146
4.2抽取主成分147
4.2.1准备工作148
4.2.2操作方法149
4.2.3工作原理151
4.2.4更多内容152
4.2.5参考资料154
4.3使用核PCA154
4.3.1准备工作154
4.3.2操作方法154
4.3.3工作原理156
4.3.4更多内容159
4.4使用奇异值分解抽取特征160
4.4.1准备工作161
4.4.2操作方法161
4.4.3工作原理162
4.4.4更多内容163
4.5用随机映射给数据降维164
4.5.1准备工作164
4.5.2操作方法165
4.5.3工作原理166
4.5.4更多内容167
4.5.5参考资料168
4.6用NMF分解特征矩阵168
4.6.1准备工作169
4.6.2操作方法170
4.6.3工作原理172
4.6.4更多内容175
4.6.5参考资料176
第5章数据挖掘——海底捞针177
5.1简介177
5.2使用距离度量178
5.2.1准备工作178
5.2.2操作方法179
5.2.3工作原理180
5.2.4更多内容183
5.2.5参考资料184
5.3学习和使用核方法184
5.3.1准备工作184
5.3.2操作方法185
5.3.3工作原理186
5.3.4更多内容187
5.3.5参考资料187
5.4用k-means进行数据聚类188
5.4.1准备工作188
5.4.2操作方法190
5.4.3工作原理191
5.4.4更多内容192
5.4.5参考资料193
5.5学习向量量化193
5.5.1准备工作193
5.5.2操作方法194
5.5.3工作原理197
5.5.4更多内容199
5.5.5参考资料199
5.6在单变量数据中找出异常点200
5.6.1准备工作200
5.6.2操作方法202
5.6.3工作原理203
5.6.4更多内容205
5.6.5参考资料207
5.7使用局部异常因子方法发现异常点207
5.7.1准备工作207
5.7.2操作方法208
5.7.3工作原理210
5.7.4更多内容216
第6章机器学习1217
6.1简介217
6.2为建模准备数据218
6.2.1准备工作218
6.2.2操作方法218
6.2.3工作原理221
6.2.4更多内容222
6.3查找最近邻223
6.3.1准备工作224
6.3.2操作方法226
6.3.3工作原理227
6.3.4更多内容229
6.3.5参考资料230
6.4用朴素贝叶斯分类文档230
6.4.1准备工作232
6.4.2操作方法232
6.4.3工作原理238
6.4.4更多内容242
6.4.5参考资料242
6.5构建决策树解决多类问题243
6.5.1准备工作244
6.5.2操作方法247
6.5.3工作原理249
6.5.4更多内容251
6.5.5参考资料252
第7章机器学习2253
7.1简介253
7.2回归方法预测实数值254
7.2.1准备工作255
7.2.2操作方法256
7.2.3工作原理259
7.2.4更多内容263
7.2.5参考资料267
7.3学习L2缩减回归——岭回归267
7.3.1准备工作268
7.3.2操作方法268
7.3.3工作原理271
7.3.4更多内容273
7.3.5参考资料276
7.4学习L1缩减回归——LASSO276
7.4.1准备工作277
7.4.2操作方法277
7.4.3工作原理280
7.4.4更多内容283
7.4.5参考资料283
7.5L1和L2缩减交叉验证迭代283
7.5.1准备工作284
7.5.2操作方法284
7.5.3工作原理288
7.5.4更多内容294
7.5.5参考资料295
第8章集成方法296
8.1简介296
8.2理解集成——挂袋法297
8.2.1准备工作298
8.2.2操作方法298
8.2.3工作原理300
8.2.4更多内容304
8.2.5参考资料305
8.3理解集成——提升法305
8.3.1准备工作307
8.3.2操作方法307
8.3.3工作原理312
8.3.4更多内容319
8.3.5参考资料319
8.4理解集成——梯度提升320
8.4.1准备工作321
8.4.2操作方法321
8.4.3工作原理325
8.4.4更多内容330
8.4.5参考资料330
第9章生长树331
9.1简介331
9.2从生长树到生长森林——随机森林332
9.2.1准备工作333
9.2.2操作方法333
9.2.3工作原理336
9.2.4更多内容340
9.2.5参考资料342
9.3生成超随机树342
9.3.1准备工作343
9.3.2操作方法343
9.3.3工作原理345
9.3.4更多内容349
9.3.5参考资料349
9.4生成旋转森林349
9.4.1准备工作350
9.4.2操作方法350
9.4.3工作原理353
9.4.4更多内容358
9.4.5参考资料358
第10章大规模机器学习——在线学习359
10.1简介359
10.2用感知器作为在线学习算法360
10.2.1准备工作361
10.2.2操作方法362
10.2.3工作原理363
10.2.4更多内容366
10.2.5参考资料367
10.3用随机梯度下降解决回归问题367
10.3.1准备工作369
10.3.2操作方法369
10.3.3工作原理370
10.3.4更多内容373
10.3.5参考资料375
10.4用随机梯度下降解决分类问题375
10.4.1准备工作376
10.4.2操作方法376
10.4.3工作原理377
10.4.4更多内容379
10.4.5参考资料380

部分内容试读

暂无.

关于此书评价

暂无.

书摘内容

暂无.

Python数据科学指南最新最全的试读、书评、目录、简介信息由Python中文网整理提供。

上一篇:没有了

下一篇:Python全栈开发实践入门