一个python包,用于使用四分位范围(IQR)从数据集中删除异常值

outlierRemoval-kjindal-101703299的Python项目详细描述


利用四分位间距去除离群值

Project 2:UCS633

提交人:Kunal Jindal 101703299


pypi:https://pypi.org/project/outlierRemoval-kjindal-101703299/


四分位间距(IQR)描述

任何一组数据都可以用它的五位数摘要来描述。这五个数字为您提供了查找模式和异常值所需的信息,包括:

数据集的最小值或最小值。 第一个四分位数Q1,表示所有数据列表的四分之一。 数据集的中值,表示整个数据列表的中点。 第三个四分位数Q3,表示所有数据列表中四分之三的数据。 数据集的最大值或最高值。 这五个数字告诉一个人更多的关于他们的数据,而不是一次看所有的数字,或者至少让这更容易。在

像质比的计算

IQR=Q3–Q1 MIN=Q1-(1.5IQR) 最大值=Q3+(1.5IQR) 在

安装

使用包管理器pip安装离群删除-kjindal-101703299。在

pip install outlierRemoval-kjindal-101703299

如何使用此软件包:

如下图所示删除Jindal-3299:

在命令提示符

^{pr2}$

示例数据集

MarksStudents
3Student1
57Student2
65Student3
98Student4
43Student5
44Student6
54Student7
99Student8
1Student9

删除后输出数据集

^{tb2}$

很明显,包含Student1、Student8和Student9的行已被删除,因为它们是异常值。在

许可证

MIT

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我应该卸载Eclipse,还是只在上面安装一个新版本?   Java For Loop i++在For Loop中做什么?   java防止击键从JTable级联到顶层   java在为GUI和游戏划分类时遇到问题:GUI未连接到游戏   客户端调用时java RMI服务器ClassNotFoundException   java如何在libgdx/box2d中为特定实体强制执行最大速度?   java在Selenium Webdriver中调用href值   java IndexOutOfBounds异常向ArrayList添加项   java修剪JsonNode中的所有字符串值   带填充列表的thymeleaf中的java空索引异常   JPanel中的java插入按钮   java应该在实现中添加Javadoc注释吗?   java JNI不满意的链接错误,尽管一切似乎都很好   java使用Youtube Api V3搜索Youtube视频