从具有相同值的多行获取相关性（Python）

1条回答

网友

1楼 · 发布于 2024-09-29 21:48:57

目前还不完全清楚您在groupby中寻找什么，但我怀疑您正在寻找.agg来聚合字段。你知道吗

例如，这将给出一个以逗号分隔的基因列表，以及Value1的平均值：

In [26]: df
Out[26]:
   Index     Gene Duplicate_of  Value1  Value2  Value3 Etc.
0      0    Gene1       DGene1     0.1    14.0      13   ..
1      1   Gene14       DGene1     0.0    13.0      17   ..
2      2    Gene4       DGene3    20.0     0.0       0   ..
3      3   Gene90       DGene3    25.0     0.0      10   ..
4      4   Gene22      DGene31     0.0    10.0       0   ..
5      5   Gene40      DGene31    10.0     0.5       0   ..
6      6  Gene130      DGene31    10.0     1.0       0   ..
7      7  Gene600      DGene31    12.0     0.0       0   ..

In [27]: df.groupby("Duplicate_of").agg({'Gene': ', '.join, 'Value1': np.mean})
Out[27]:
                                          Gene  Value1
Duplicate_of
DGene1                           Gene1, Gene14    0.05
DGene3                           Gene4, Gene90   22.50
DGene31       Gene22, Gene40, Gene130, Gene600    8.00

相关问题更多 >

编程相关推荐

热门问题

热门文章

从具有相同值的多行获取相关性（Python）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >