我有一个数据帧(250×25),其中20列具有数值(int64和float64的混合)
我想打印包含异常值的列
mydata = pd.read_csc('data.csv')
df = mydata.select_dtypes(include=np.number)
Q1 = df.quantile(0.25)
Q3 = df.quantile(0.75)
IQR = Q3 - Q1
df = df[((df < (Q1 - 1.5 * IQR)) |(df > (Q3 + 1.5 * IQR))).any(axis=1)]
print(df.columns)
我通过excel发现只有4列有异常值。我不知道怎么弄到它们
以下是数据:
不应该有异常值。我们尝试您的布尔值:
这将返回错误的行布尔值。您需要在另一个轴上执行此操作,还需要在列上执行此操作:
让我们将异常值放在两列中,应该返回c3和c4:
相关问题 更多 >
编程相关推荐