从数据帧列中删除部分字符串

flag = '(ABC|DEF)' andFlag = '&' + flag #the reasoning for doing this is that 'flag' may change #Below are all different ways I have tried to achieve this, none have worked. df['Expression'] = df['Expression'].replace(andFlag, '', regex=True) df['Expression'] = df['Expression'].apply(lambda x: re.sub(andFlag, '', x)) df['Expression'] = df['Expression'].replace(to_replace=andFlag, value= '', regex=True) df['Expression'] = df['Expression'].str.replace(andFlag, '') df['Expression'] = df['Expression'].str.replace(andFlag, '', regex=True)

2条回答

网友

1楼 · 编辑于 2024-09-28 13:09:45

使用str.replace更重要的是，设置regex=False进行文字匹配：

df['Expression'] = df['Expression'].str.replace(andFlag, '', regex=False)

      Expression
0            XYZ
1  (HIJ&FTL&JKK)
2  (FML|AXY|AND)

网友

2楼 · 编辑于 2024-09-28 13:09:45

括号和竖线是正则表达式中的特殊字符，因此如果要匹配这些字符，可以在前面添加反斜杠“\”，例如：

flag = '\(ABC\|DEF\)' #see this is changed
andFlag = '&' + flag
print (df['Expression'].replace(andFlag, '', regex=True))

0              XYZ
1    (HIJ&FTL&JKK)
2    (FML|AXY|AND)
Name: Expression, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章