一个python包,用于使用四分位范围(IQR)从数据集中删除异常值
outlierRemoval-kjindal-101703299的Python项目详细描述
利用四分位间距去除离群值
Project 2:UCS633
提交人:Kunal Jindal 101703299
pypi:https://pypi.org/project/outlierRemoval-kjindal-101703299/
四分位间距(IQR)描述
任何一组数据都可以用它的五位数摘要来描述。这五个数字为您提供了查找模式和异常值所需的信息,包括:
数据集的最小值或最小值。 第一个四分位数Q1,表示所有数据列表的四分之一。 数据集的中值,表示整个数据列表的中点。 第三个四分位数Q3,表示所有数据列表中四分之三的数据。 数据集的最大值或最高值。 这五个数字告诉一个人更多的关于他们的数据,而不是一次看所有的数字,或者至少让这更容易。在
像质比的计算
IQR=Q3–Q1 MIN=Q1-(1.5IQR) 最大值=Q3+(1.5IQR) 在
安装
使用包管理器pip安装离群删除-kjindal-101703299。在
pip install outlierRemoval-kjindal-101703299
如何使用此软件包:
如下图所示删除Jindal-3299:
在命令提示符
^{pr2}$示例数据集
Marks | Students |
---|---|
3 | Student1 |
57 | Student2 |
65 | Student3 |
98 | Student4 |
43 | Student5 |
44 | Student6 |
54 | Student7 |
99 | Student8 |
1 | Student9 |
删除后输出数据集
^{tb2}$很明显,包含Student1、Student8和Student9的行已被删除,因为它们是异常值。在
许可证
- 项目
标签: