twitterapi:如何使用给定的API列表解析tweet文本中的URL

2024-06-26 14:53:16 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我使用Python和Twitter API,使用Tweepy和Twitter的streamapi,后者实时返回Tweet对象。我的应用程序中查询不同API的部分不能很好地处理tweet文本中的url,所以我使用Pythonre模块将它们替换为无害的标识符字符串。但是,我很难找到需要从文本中解析出来的url。我不必自己在文本中搜索url,而是决定使用API提供的url并在文本中执行“查找和替换”。在

Here is关于API提供给我的文档。它提供了一个t.co url、一个显示url和一个完全展开的url。仅仅使用t.co网址的问题是,twitter不会自动将tweets中的所有url转换为t.co,只有那些超过一定长度的url。这意味着t.co的url并不总是出现在tweet文本中的同一个。在

因此,我需要弄清楚如何从API中获取实际出现在tweet文本中的URL版本。在

谢谢! 依凡维德


Tags: 模块对象字符串文本api应用程序urltwitter
1条回答
网友
1楼 · 发布于 2024-06-26 14:53:16

尝试对extended_url使用此方法:

tweet_url = str(tweet.expanded_url) # you might not need str(), 
#test it yourself if you'd like.

# Replace tweet by the loop/function you have the json extracted with

tweet_url = tweet_url.replace('\\', '')

print(tweet_url)

你应该给你的链接没有你想要的方式。在

相关问题 更多 >