2024-06-13 06:34:04 发布
网友
我目前正在用Praw/Python收集用户对Reddit的评论,我希望在查询时能超越上限(1k)。在
我读过一些关于Cloudsearch语法的文章,其中可以创建时间戳和多次查询,但我无法完全理解其中的内容。有人能解释一下吗?谢谢!在
我目前的目标是:
dh = reddit.redditor(USERNAME) count = 0 for c in dh.comments.new(limit = None): print c.subreddit
这总是给我计数=1000。。。在
Reddit的列表页面,与您浏览subreddit或用户页面时看到的页面一样,都限制在1000个条目以内。当添加或更新适用于给定列表的新项目时,例如投票表决,它将插入该列表中的正确位置,删除超过1000项限制的任何项目。在
Reddit的搜索是不同的。虽然每个单独的搜索本身都有类似的1000项限制,但时间戳可以用来缩小搜索结果的范围。通过对最新结果进行排序,并跟踪最旧结果的时间戳,可以成功地在连续搜索中循环。在
PRAW的submissions正是这样做的: http://praw.readthedocs.io/en/latest/code_overview/models/subreddit.html#praw.models.Subreddit.submissions
submissions
注意:搜索仅对提交的内容有效
Reddit的列表页面,与您浏览subreddit或用户页面时看到的页面一样,都限制在1000个条目以内。当添加或更新适用于给定列表的新项目时,例如投票表决,它将插入该列表中的正确位置,删除超过1000项限制的任何项目。在
Reddit的搜索是不同的。虽然每个单独的搜索本身都有类似的1000项限制,但时间戳可以用来缩小搜索结果的范围。通过对最新结果进行排序,并跟踪最旧结果的时间戳,可以成功地在连续搜索中循环。在
PRAW的
submissions
正是这样做的: http://praw.readthedocs.io/en/latest/code_overview/models/subreddit.html#praw.models.Subreddit.submissions注意:搜索仅对提交的内容有效
相关问题 更多 >
编程相关推荐