替换数据帧列中的多个字符串

2024-09-29 19:34:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一个简单的方法来替换几个字符串,并用更新的替换将其分配给一个新的df

这是我正在使用的示例列df['column']

Column
-----------------
K700E
R957Q
Deletion
L747_T751delinsP
S752_I759del
I491M
D770_P772dup
G719A
G735S
N771_H773dup
K467T
E746_T751insIP
D770_N771insD
G724S
K745_A750del
EGFRvIII
V765A
EGFRvII
L858M

有些条目包含我不需要的文本,基本上需要清理。下面是我的代码,我似乎不明白。在

^{pr2}$

还有一些条目,比如

EGFR-RAD51 Fusion

我基本上想去掉“融合”这个词,但保留“EGFR”。在

新手如有任何建议,将不胜感激。=)


Tags: 方法字符串示例df条目columndeletionegfr
2条回答

备选答案


还可以传递包含要替换的键和值的字典:

rdict = {
    "Truncating Mutations":"9999", 
    "Amplification":"9999",
    "Fusion":""
    }

df[0] = df[0].replace(rdict)

df.replace不是就地操作。另外,您可以使用regex=True并组合前两个替换项。第三种方法也可以遵循,而且更简单,因为您只删除Fusion。在

df['Column'] = df['Column'].replace('(?:Truncating Mutations)|(?:Amplification)', '9999', regex=True)\
                           .replace('Fusion', '')

一旦执行了替换,就可以使用df['Column'] = ...将结果分配到原位。在

相关问题 更多 >

    热门问题