Twitter(:如何提取包含tweets的符号!,%,$)?

2024-10-02 02:26:56 发布

您现在位置:Python中文网/ 问答频道 /正文

对于一个项目,我希望能够创建一个包含特定符号串的tweet数据集。因为我也希望尽可能回到过去,所以我尝试使用这里提到的GetOldTweets脚本(https://github.com/Jefferson-Henrique/GetOldTweets-python):https://stackoverflow.com/a/35077920/5858873。在

问题是,它无法提取包含符号的tweet作为输入。事实上,人们甚至不能直接在Twitter上搜索包含所需符号的tweet。在

为了更清楚地解释这个问题,考虑下面的示例案例。我想提取所有包含字符串“!!!”在过去两年里。在

如果这是最好的办法,怎么办?在


Tags: 数据项目httpsgithub脚本com示例符号
3条回答

您可以根据需要创建自己的正则表达式,并且
然后点击twitter数据来提取特定的tweets。在

我发现了一个有趣的资源:https://webapps.stackexchange.com/questions/92196/search-for-tweets-with-special-characters

它基本上是说某些字符无法搜索,因为Twitter已经阻止了它们的使用。在

我相信你应该做的是在某个范围内搜索所有的tweets,然后在每个tweet的body消息上使用string方法find。当您到达某个运行时或找到特定数量的tweet时,您将停止。在

你可以从Twitter API下载和存储数据,使用不同的标准(在字典中搜索单词、位置搜索、流行的Twitter帐户等),虽然不能确定全部数据,但你会有部分数据。在

然后在本地搜索这些tweets。在

这些字符在url中也是有效的,所以在搜索之前去掉url的字符。在

另外,别忘了检查你从Twitter上获取的数据是否合法。在

相关问题 更多 >

    热门问题