我是Python新手,所以,我认为这只是一个基础,但我找不到它。 我有一个由100个问题组成的数据框架
|Date|QID|Time_1|Answer_1|Time_2|Answer_2|Time_3|Answer_3|
|1/12|001|20 | A | 30 | A | 34 | D |
|1/12|001|22 | A | 10 | A | 12 | D |
|1/12|002|27 | B | 40 | A | 45 | D |
|1/12|002|25 | A | 60 | C | 23 | D |
所以,我想要一个时间的描述性统计数据,比如总时间的max,min,mean
在样本数据中,这是输出:
输出
|QID| Mean | Min | Max |
|001| 21.33| 10 | 34 |
|002| 36.67| 23 | 60 |
我该怎么做
我有用
df.mean(axis=1)
df.max(axis=1)
df.min(axis=1)
但是如何在QID的基础上使用group by找到描述性统计
先谢谢你
解决方案的主要复杂性是不存在
mean
的mean
,因此有必要根据定义创建mean
——它是sum
的和除以count
的和因此,首先使用^{} 获得每行的聚合,而不是} ,然后聚合
mean
使用sum
和^{sum
、min
和max
,最后为mean
划分列:使用
df.describe()
它会产生你想要的所有信息.describe()
是一个数据帧方法,因此可以将它粘贴在任何返回DataFrame
对象的GroupBy语句的末尾以下是文档:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html
相关问题 更多 >
编程相关推荐