归档reddit用户的发布历史记录。配置文件的格式化概述、包含每个帖子的JSON和图片下载。

redditsfinder的Python项目详细描述


redditfinder---reddit用户信息

pip3 install redditsfinder

一个命令行程序,可以轻松下载reddit用户的日志。

使用一个命令获取任何reddit用户的整个post历史记录,同时避免redditapi的1000 post限制。
这个程序的主要部分是向pushshift发出请求,并操作pushshift的JSON以获得更具可读性的all_posts.json文件文件。
我还制作了一个简单的图像下载器,避免了一次从不同站点抓取多个图像的许多问题。例如文件类型不是文件编码的格式,以及更改的URL。或以.png结尾的URL,返回ASCII文本。它可以获得imgur相册和图片,因为至少有一段时间imgur基本上是reddit的非官方图像托管服务。在

彩色终端特性和标记来自https://github.com/willmcgugan/rich
pip3 install rich这是我见过的最酷的python包之一。它很容易理解,但正如自述中的动画示例所示,它仍然有很多深度。在

https://github.com/LoLei/redditcleanerpip3 install redditcleaner对于处理reddit的奇怪标记也是一个巨大的帮助。
如果评论和自传的格式相当多,那么当它们以JSON等其他格式放置时,它们可能无法读取。
为了解决这个问题,我放弃了,在网上寻找另一种选择。幸运的是,有一个好的现成的。在

安装

pip3 install redditsfinder

正在运行ReditsFinder

在自己身上测试它,以确保它能工作。

redditsfinder yourusername

基本用法

将每个帖子返回给每个用户的不同JSON文件,并在终端中格式化一个表格,以便快速查看。
接受任意数量的用户名,以便至少有一个用户名。


redditsfinder username
redditsfinder [options] username_0 username_1 username_2 ...

换行分隔文件

使用文件中的用户名。

-f或{}
redditsfinder [options] -f line_separated_text_file.txt

可选参数

-pics返回图像上载的URL。
-pics -d或{}下载它们。
-q或{}关闭与日志无关的打印语句。在

推送请求日志示例

Imgur Image

端子表示例

Imgur Image

JSON对象示例

Imgur Image

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何计算大于平均值的数字的百分比。?   JavaFX中后台执行任务的服务   xml解析用于解析java中推荐的xml解析器的小文档   java Nativescript+无法实例化接收器。。。。没找到上课的机会   maven是在数百个Java测试类上应用自定义JUnit测试运行程序的更简单方法   泛型如何引用接口在Java中实现的类类型?   java序列化程序SimpleXML只发送第一行   java字符串组合/排列   java无法创建EMRclient Sdkclientexception   JavaMaven不生成“persistence.xml”文件   java找不到主要方法   java中的正则表达式正负双精度   接口对于我试图解决的问题,有Java设计模式吗?   java在创建bean时获取异常   java如何创建<?使用JCodeModel扩展子类型>?   java在javafx中制作搜索栏   java Compare Hashmap with List=new Arraylist()   java接口与具体类