如何在dataframe中使用groupby查找描述性统计信息

|Date|QID|Time_1|Answer_1|Time_2|Answer_2|Time_3|Answer_3| |1/12|001|20 | A | 30 | A | 34 | D | |1/12|001|22 | A | 10 | A | 12 | D | |1/12|002|27 | B | 40 | A | 45 | D | |1/12|002|25 | A | 60 | C | 23 | D |

2条回答

网友

1楼 · 编辑于 2024-09-29 21:59:06

解决方案的主要复杂性是不存在mean的mean，因此有必要根据定义创建mean——它是sum的和除以count的和

因此，首先使用^{}获得每行的聚合，而不是mean使用sum和^{}，然后聚合sum、min和max，最后为mean划分列：

cols = df.filter(like='Time').columns

df1 = df[cols].agg(['sum','size','min','max'], axis=1)
df = df1.groupby(df['QID']).agg(m1=('sum','sum'),
                                m2=('size','sum'),
                                Min=('min','min'),
                                Max=('max','max'))
df = df.assign(Mean=df.pop('m1').div(df.pop('m2'))).reset_index()
print (df)
   QID  Min  Max       Mean
0    1   10   34  21.333333
1    2   23   60  36.666667

网友

2楼 · 编辑于 2024-09-29 21:59:06

使用df.describe()它会产生你想要的所有信息.describe()是一个数据帧方法，因此可以将它粘贴在任何返回DataFrame对象的GroupBy语句的末尾

以下是文档：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html

相关问题更多 >

编程相关推荐

热门问题

热门文章