使用agg函数时pandas值出错

2024-09-30 20:29:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在熟悉熊猫,我遇到了一个我找不到答案的问题。在

我正在使用此处提供的数据集https://raw.githubusercontent.com/Shreyas3108/house-price-prediction/master/kc_house_data.csv

然后我运行函数df.describe(),它可以毫无问题地输出它应该输出的所有内容。在

由于我目前只对min/max的min、max和diff感兴趣,所以我使用pandas的df.agg函数通过运行以下代码来获得每列的min/max

df.agg([min, max],axis=0)

当我运行这个时,我得到一个错误:

^{pr2}$

df.describe()能够毫无问题地找到每列的最小值/最大值时,我不确定为什么会出现此错误。我查找了blank和NaN值,并查找了字符串,看看它们是否产生了问题,而我的数据似乎没有它们。在

如果你能告诉我哪里出了问题,我会很感激的。在


Tags: 数据函数答案httpscomdfraw错误
2条回答

我已经尝试了下面的代码,并且能够成功地完成您在您的问题中提到的。在

df = pd.read_csv('https://raw.githubusercontent.com/Shreyas3108/house-price-prediction/master/kc_house_data.csv')
df = df.agg([min, max]).T
CLM = ['max', 'min']
df = (df.drop(CLM, axis=1)
         .join(df[CLM].apply(pd.to_numeric, errors='coerce')))

df = num_df[num_df[CLM].notnull().all(axis=1)]
df['Diff'] = df['max'] - df['min']
df

请试试这个,让我知道这是否适合你。在

问题可能不在df.agg而是在df本身。您可以先调用df,然后再调用df.agg,看看它是否真的包含数据。在

相关问题 更多 >