一个python包,用于使用四分位范围(IQR)从数据集中删除异常值
outlierRemoval-kvarshney-101703295的Python项目详细描述
利用四分位间距去除离群值
Project 2:UCS633
提交人:Kshitiz Varshney 101703295
pypi:https://pypi.org/project/outlierRemoval-kvarshney-101703295/
四分位间距(IQR)描述
任何一组数据都可以用它的五位数摘要来描述。这五个数字为您提供了查找模式和异常值所需的信息,包括:
数据集的最小值。 第一个四分位数Q1,表示所有数据列表的四分之一(25%)。 数据集的中值,表示整个数据列表的中点(50%)。 第三个四分位数Q3,表示所有数据列表中四分之三(75%)。 数据集的最大值或最高值。 这五个值帮助我们确定数据集中的异常值。在
像质比的计算
IQR=第3季度–第1季度 MIN=Q1-(1.5IQR) 最大值=Q3+(1.5IQR) 在
安装
使用包管理器pip安装离群删除-kvarshney-101703295。在
pip install outlierRemoval-kvarshney-101703295
如何使用此软件包:
OutlierRemovement-kvarshney-101703295可以运行如下:
在命令提示符
^{pr2}$示例数据集
Marks | Students |
---|---|
3 | Student1 |
57 | Student2 |
65 | Student3 |
98 | Student4 |
43 | Student5 |
44 | Student6 |
54 | Student7 |
99 | Student8 |
删除后输出数据集
^{tb2}$很明显,包含Student1和student8的行已被删除,因为它们是异常值。在
许可证
- 项目
标签: