从数据帧拆分行值和计数唯一值

3条回答

网友

1楼 · 编辑于 2024-09-26 18:14:27

您可以使用正则表达式替换最后两位数字，如下所示：

df = pd.DataFrame({'a':['ABS052','ABS052/01','ABS052/02','ADA010/00','ADD005','ADD005/01','ADD005/02','ADD005/03','ADD005/04','ADD005/05']})
df = df['a'].str.replace(r'\/\d+$', '').value_counts().reset_index()

输出：

>>>>    index   a
    0   ADD005  6
    1   ABS052  3
    2   ADA010  1

网友

2楼 · 编辑于 2024-09-26 18:14:27

就快到了，您可以将expand=True添加到split，然后使用groupby：

df['Reference'].str.split("/", expand=True).fillna("--").groupby(0).count()

对于数据的前几行

fillna("--")确保您还可以计算像ABS052这样没有“”的行，即第二列中的None

网友

3楼 · 编辑于 2024-09-26 18:14:27

问题中列出的预期结果似乎有问题

假设您要舍弃数字并计算前缀出现的次数：

df.Reference.str.split("/", expand=True)[0].value_counts()

相反，如果后缀表示某事，并且您希望保持最高值，则应该这样做

df.Reference.str.split("/", expand=True).fillna("00").astype({0: str, 1: int}).groupby(0).max()

相关问题更多 >

编程相关推荐

热门问题

热门文章

从数据帧拆分行值和计数唯一值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >