如何删除python数据帧中最后一个下划线后的字符串？

网友

1楼 · 编辑于 2024-09-25 00:28:26

pd.DataFrame({'col': ['AA_XX', 'AAA_BB_XX', 'AA_BB_XYX', 'AA_A_B_YXX']})['col'].apply(lambda r: '_'.join(r.split('_')[:-1]))

解释：

df = pd.DataFrame({'col': ['AA_XX', 'AAA_BB_XX', 'AA_BB_XYX', 'AA_A_B_YXX']})

创造

    col
0   AA_XX
1   AAA_BB_XX
2   AA_BB_XYX
3   AA_A_B_YXX

使用“应用”循环浏览要编辑的列。
我在_处断开字符串，然后连接所有部分，最后一部分在_

df['col'] = df['col'].apply(lambda r: '_'.join(r.split('_')[:-1]))
print(df)

结果:

    col
0   AA
1   AAA_BB
2   AA_BB
3   AA_A_B

如果数据集包含像AA这样的值（不带下划线的值）。
像这样改变lambda

df = pd.DataFrame({'col': ['AA_XX', 'AAA_BB_XX', 'AA_BB_XYX', 'AA_A_B_YXX', 'AA']})
df['col'] = df['col'].apply(lambda r: '_'.join(r.split('_')[:-1]) if len(r.split('_')) > 1 else r)
print(df)

网友

2楼 · 编辑于 2024-09-25 00:28:26

这是另一种方法

import pandas as pd
data = {'s': ['AA_XX', 'AAA_BB_XX', 'AA_BB_XYX', 'AA_A_B_YXX']}
df = pd.DataFrame(data)

def cond1(s):
    temp_s = s.split('_')
    temp_len = len(temp_s)
    if len(temp_s) == 1:
        return temp_s
    else:
        return temp_s[:len(temp_s)-1]
df['result'] = df['s'].apply(cond1)

网友

3楼 · 编辑于 2024-09-25 00:28:26

您只需使用^{}和^{}即可完成此操作：

In [2381]: df
Out[2381]: 
         col1
0       AA_XX
1   AAA_BB_XX
2   AA_BB_XYX
3  AA_A_B_YXX

In [2386]: df['col1'] = df['col1'].str.split('_').str[:-1].str.join('_')

In [2387]: df
Out[2387]: 
     col1
0      AA
1  AAA_BB
2   AA_BB
3  AA_A_B

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何删除python数据帧中最后一个下划线后的字符串？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >