一个python包,用于使用四分位范围(IQR)从数据集中删除异常值

outlierRemoval-kvarshney-101703295的Python项目详细描述


利用四分位间距去除离群值

Project 2:UCS633

提交人:Kshitiz Varshney 101703295


pypi:https://pypi.org/project/outlierRemoval-kvarshney-101703295/


四分位间距(IQR)描述

任何一组数据都可以用它的五位数摘要来描述。这五个数字为您提供了查找模式和异常值所需的信息,包括:

数据集的最小值。 第一个四分位数Q1,表示所有数据列表的四分之一(25%)。 数据集的中值,表示整个数据列表的中点(50%)。 第三个四分位数Q3,表示所有数据列表中四分之三(75%)。 数据集的最大值或最高值。 这五个值帮助我们确定数据集中的异常值。在

像质比的计算

IQR=第3季度–第1季度 MIN=Q1-(1.5IQR) 最大值=Q3+(1.5IQR) 在

安装

使用包管理器pip安装离群删除-kvarshney-101703295。在

pip install outlierRemoval-kvarshney-101703295

如何使用此软件包:

OutlierRemovement-kvarshney-101703295可以运行如下:

在命令提示符

^{pr2}$

示例数据集

MarksStudents
3Student1
57Student2
65Student3
98Student4
43Student5
44Student6
54Student7
99Student8

删除后输出数据集

^{tb2}$

很明显,包含Student1和student8的行已被删除,因为它们是异常值。在

许可证

MIT

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javaelk:如何在Kibana中按异常类对stacktrace进行分组   java两个组件使用MigLayout相互重叠   java Hibernate标准获取关联实体的列表,而不是父实体的列表   从Java关闭另一个应用程序,但不是由当前Java应用程序启动   java使用OGNL获取参数   java如何在SSLEngine中启用密码TLS\U DHE\U RSA\U和\U AES\U 256\U GCM\U SHA384   在Java中有效地比较两个列表<Object[]>   java杀死挂起的线程   在java中从指定模式前后的字符串中提取子字符串   存储整数的java HashMap替代方案   java如何使用LibGDX加载特定于语言的资产?   java如何使用JSON响应从维基百科读取结构化数据   java无法连接到Spark Master:原因是:[已解除关联]   java如何配置Elastic beanstalk classic负载平衡器以使用CLI终止HTTPS   java筛网中的奥斯汀大于int   java PircBot在每个用户上迭代一组命令   java将带有Jackson的hashmap编组为XML的错误结构   testng中的java设置testfailure给出了正回报   java如何在IntelliJ中正确配置Eclipse项目?