这是起始数据表:
Organ 1000.1 2000.1 3000.1 4000.1 ....
a 333 34343 3434 23233
a 334 123324 1233 123124
a 33 2323 232 2323
b 3333 4444 333 34444
b 33333 3333 333 33333
.
.
.
等等。这些数字只是随机数,“器官”列的值包含一些重复项,如您所见
我试图计算计数、平均值和标准差,以便计算p值,如:
data = pd.read_excel('file')
data_stat = data.groupby(data.columns[0]).aggregate(['count','mean','std'])
这会计算这三个参数,但格式错误:
上面的屏幕截图与示例数据表不匹配,只是想显示结果格式。尝试使用reset_index(),但无效:
有没有关于我如何删除包含“Organe”文本的行的建议(删除该行后,将所有内容向上移动,这样就不会出现空白行)
当然,如果不需要反汇编第一行来计算p值,则不需要反汇编第一行。我的最终目标是为每一列计算每一行的所有可能组合(如a对b、a对c、a对d、a对e、…、b对c、b对d等)之间的p值,我有一种感觉,如果我再次陷入困境,这将在将来创建另一个帖子
您可以在列中获得
MultiIndex
,对于更改第一列,请使用:有关} :
MultiIndex
的显示值是否可以使用,请选中^{最简单的方法是通过展平来避免
MulitIndex
:相关问题 更多 >
编程相关推荐