如何使用Python从twitter推文中删除图片URL

2条回答

网友

1楼 · 编辑于 2024-10-03 09:17:02

这样做：

df['text'] = df['text'].str.replace(r'pic.twitter.com(.*?)\s(.*)', '')

(.*?)\s(.*)将其放在每个帖子特定的url的其余部分

网友

2楼 · 编辑于 2024-10-03 09:17:02

import re
def cleaning_PicURL (text):
    text = re.sub(r'pic.twitter.com/[\w]*',"", text)
    return text

df['text'] = df['text'].apply(lambda x: cleaning_PicURL(x))

使用上面的代码，它将从文本中删除图片URL，这里split函数将文本拆分为匹配的正则表达式模式，并给我们一个列表。在tweets中，您可能不确定图片URL的位置，因此使用sub函数而不是split函数更为相关，因为sub函数将直接删除带有空字符串的匹配文本，这对您来说很容易。正则表达式模式pic.twitter.com/[\w]*将有助于匹配文本中的所有twitter图片URL。希望这能消除你的疑虑

例如：

re.sub(r'pic.twitter.com/[\w]*',"", "test pic.twitter.com/va4nFjFQ5B")
'test '

这样做：

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Python从twitter推文中删除图片URL

这样做：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >