根据表中其他列的值计数，添加带有数字的列

2条回答

网友

1楼 · 编辑于 2024-10-03 02:48:37

使用groupby_cumcount：

df['colB'] = df.groupby('colA').cumcount().add(1)
print(df)

# Output
   colA  colB
0  BJ02     1
1  BJ02     2
2  CJ02     1
3  CJ03     1
4  CJ02     2
5  DJ01     1
6  DJ02     1
7  DJ07     1
8  DJ07     2
9  DJ07     3

@HenryEcker建议使用zfill：

df['colB'] = df.groupby('colA').cumcount().add(1).astype(str).str.zfill(3)
print(df)

# Output:
   colA colB
0  BJ02  001
1  BJ02  002
2  CJ02  001
3  CJ03  001
4  CJ02  002
5  DJ01  001
6  DJ02  001
7  DJ07  001
8  DJ07  002
9  DJ07  003

网友

2楼 · 编辑于 2024-10-03 02:48:37

可以使用Counter（）计算colA中每个值的频率，然后创建一个函数来生成colB的值列表

from collections import Counter    
def count_value(colA):
     new_col = []
     colA = df[colA].tolist()
     freq_table = Counter(colA) # count the frequency of each value
     for value in colA:
          new_col.append('00' + str(freq_table[value]))
     return new_col
df['colB'] = count_value(df['colA'])

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据表中其他列的值计数，添加带有数字的列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >