归档reddit用户的发布历史记录。配置文件的格式化概述、包含每个帖子的JSON和图片下载。
redditsfinder的Python项目详细描述
redditfinder---reddit用户信息
pip3 install redditsfinder
一个命令行程序,可以轻松下载reddit用户的日志。
使用一个命令获取任何reddit用户的整个post历史记录,同时避免redditapi的1000 post限制。
这个程序的主要部分是向pushshift发出请求,并操作pushshift的JSON以获得更具可读性的all_posts.json文件文件。
我还制作了一个简单的图像下载器,避免了一次从不同站点抓取多个图像的许多问题。例如文件类型不是文件编码的格式,以及更改的URL。或以.png结尾的URL,返回ASCII文本。它可以获得imgur相册和图片,因为至少有一段时间imgur基本上是reddit的非官方图像托管服务。在
彩色终端特性和标记来自https://github.com/willmcgugan/richpip3 install rich
这是我见过的最酷的python包之一。它很容易理解,但正如自述中的动画示例所示,它仍然有很多深度。在
https://github.com/LoLei/redditcleanerpip3 install redditcleaner
对于处理reddit的奇怪标记也是一个巨大的帮助。
如果评论和自传的格式相当多,那么当它们以JSON等其他格式放置时,它们可能无法读取。
为了解决这个问题,我放弃了,在网上寻找另一种选择。幸运的是,有一个好的现成的。在
安装
pip3 install redditsfinder
正在运行ReditsFinder
在自己身上测试它,以确保它能工作。
redditsfinder yourusername
基本用法
将每个帖子返回给每个用户的不同JSON文件,并在终端中格式化一个表格,以便快速查看。
接受任意数量的用户名,以便至少有一个用户名。redditsfinder username
redditsfinder [options] username_0 username_1 username_2 ...
换行分隔文件
使用文件中的用户名。-f
或{redditsfinder [options] -f line_separated_text_file.txt
可选参数
-pics
返回图像上载的URL。-pics -d
或{-q
或{
推送请求日志示例
端子表示例
JSON对象示例
- 项目
标签: