使用SimpleImputer类处理丢失值的python包
missingValues-kvarshney-101703295的Python项目详细描述
使用SimpleImputer类处理缺少的值
Project 3:UCS633
提交人:Kshitiz Varshney 101703295
pypi:https://pypi.org/project/missingValues-kvarshney-101703295/
SimpleImputer类
SimpleImputer是一个scikit学习类,它有助于处理预测模型数据集中丢失的数据。 它用指定的占位符替换NaN值。 它通过使用SimpleImputer()方法实现,该方法接受以下参数: 缺失的_data:必须插补的缺失的_data占位符。默认为NaN。 stategy:将替换数据集中的NaN值的数据。策略参数可以采用值-“平均值”(默认值)、“中值”、“最频繁”和“常量”。 fill_value:使用常量策略给NaN数据的常量值。在
安装
使用包管理器pip安装missingValues-kvarshney-101703295。在
pip install missingValues-kvarshney-101703295
如何使用此软件包:
missingValues-kvarshney-101703295可以运行如下:
在命令提示符
^{pr2}$输入数据集
a | b | c |
---|---|---|
0 | NaN | 4 |
2 | NaN | 4 |
1 | 7 | 0 |
1 | 3 | 9 |
7 | 4 | 9 |
2 | 6 | 9 |
9 | 6 | 4 |
3 | 0 | 9 |
9 | 0 | 1 |
处理缺失值后输出数据集
^{tb2}$很明显,包含空值的行和列已经使用中值成功地处理了。在
许可证
- 项目
标签: