通过将所有字符列保留在

2024-09-30 22:20:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据框看起来像

    chrom   ID          Name         Sample
0   22  26920140.0  CTA15             PE12
1   22  41830075.0  CTA15             PE14
2   10  134596540.0 RP11.3           AE29
5   12  117142987.0 RP11.2         AE30
6   14  50793639.0  RP11.4          AE31

我只需要计算数据场中Name的出现次数,还需要保留其他列。所以我试着

   df['count']= df.groupby('gene', as_index=True).agg(len)

  chrom start   Name Samples
    gene                                                                                
    CTA15   2   1.0 1.0 1
    RP11.3  1   1.0 1.0 1

我看不到我的行的价值,但只是数字,任何帮助将是巨大的


Tags: 数据samplenameiddfcount次数gene
1条回答
网友
1楼 · 发布于 2024-09-30 22:20:42

使用^{}

df['count']= df.groupby('Name')['Name'].transform(len)
print (df)
   chrom           ID    Name Sample  count
0     22   26920140.0   CTA15   PE12      2
1     22   41830075.0   CTA15   PE14      2
2     10  134596540.0  RP11.3   AE29      1
5     12  117142987.0  RP11.2   AE30      1
6     14   50793639.0  RP11.4   AE31      1

df['count']= df.groupby('Name')['Name'].transform('size')
print (df)
   chrom           ID    Name Sample  count
0     22   26920140.0   CTA15   PE12      2
1     22   41830075.0   CTA15   PE14      2
2     10  134596540.0  RP11.3   AE29      1
5     12  117142987.0  RP11.2   AE30      1
6     14   50793639.0  RP11.4   AE31      1

相关问题 更多 >