我想用pythontweepy库从twitter收集数据。在
我调查了Twitter API的速率限制,即每15分钟180个请求。在
我想知道有多少数据我可以为一个特定的关键字?换一种方式,当我使用Tweepy光标,什么时候会停止?在
我不是说数学计算(100计数*180要求*4次/小时等),而是真实的经验。我发现如下观点:
“对于一个特定的关键词,你通常只能对每个关键词的最后5000条tweet进行投票。您还受到在特定时间段内可以提出的请求数量的限制。” http://www.brightplanet.com/2013/06/twitter-firehose-vs-twitter-api-whats-the-difference-and-why-should-you-care/
是否正确(如果正确,我只需要运行程序5分钟左右)?或者我需要继续得到尽可能多的tweet(这可能会使程序运行很长时间)?在
你肯定不会得到那么多的tweet。Twitter限制你能走多远(也就是说有多少条tweet可用)的方式是将一个最小的} 调用。在Tweepy中,^{} 函数与Twitter API接口。Twitter的
since_id
参数传递给Twitter API的^{GET search/tweets
文档有很多好的信息:实际上,Tweepy的
API.search
应该不会花很长时间就能获得所有可用的tweets。注意,并不是所有的tweet都可以通过Twitter API获得,但是我从来没有一个搜索时间超过10分钟。在相关问题 更多 >
编程相关推荐