如何使用str.replace清除列中的每一行

2024-10-01 07:45:06 发布

您现在位置:Python中文网/ 问答频道 /正文

这似乎是一个很容易的任务,但我不能让代码工作

我´我只是想用kaggle上的jupyter笔记本清理一张桌子上的tweet回复,只保留信件

不管我用什么代码,都好像什么都没发生

我´m尝试了以下操作:

pattern=re.compile('\[].\\n')
dfreplies.Replies.str.replace(pattern, '',regex=True)

实际结果的一个例子是:

dfreplies.Replies
>>>     Replies
0       [I need \n, [[#] a soda please]
1       [bla bla + but nice hair, [[@],]
2       [Great idea https://www.music.pe, follow us]

我想

>>>     Replies
0       I need a soda please
1       bla bla but nice hair
2       Great idea, follow us

Tags: 代码needbutpatternusnicepleasebla
1条回答
网友
1楼 · 发布于 2024-10-01 07:45:06

根据您的预期输出,您需要更复杂的替换,如下所示:

In [256]: df['Replies'].str.replace(r'([\[\]#+@]+|\\n),?\s*|\s*https?://[^\s,]+', '', regex=True)               
Out[256]: 
0       I need a soda please
1    bla bla but nice hair, 
2      Great idea, follow us
Name: Replies, dtype: object

相关问题 更多 >