一个小型网络爬虫pastebin.com网站网站
simple-pastebin-parser的Python项目详细描述
简单的Pastebin解析器
这是用于pastebin.com网站网站。在
它将迭代posts并使用lxml解析它们的元素
安装:
pip安装简单的pastebin解析器
示例用法
importsimple_pastebin_parserforpasteinsimple_pastebin_parser.get_pastes():print("Title: ",paste.Title)print("Author: ",paste.Author)print("date: ",paste.Date)print("Content: ")print(paste.Content)print("*"*20)
发行说明:
v0.1.0-P.O.C.
概念的初步证明。没什么特别的,只是在做解析帖子的脏活。在
如何执行: 1创建Python3.6的虚拟环境 2安装要求 三。运行pythonpoc.py公司在
v0.2.5(2020-03-07)
- 集成特拉维斯.ci在
v0.2.6(2020-03-07)
- 更改POC代码以使用已安装的pypi包
v0.3.0(2020-03-07)
- 为pastebin posts创建了Paste()对象
- 数据流的能力
v0.3.3(2020-03-07)
- 小修小补
v0.3.5(2020-03-07)
- 更新自述
v0.4.0(2020-03-08)
- 添加的文档
- 清除了大多数pep8问题
- 一些测试
v0.5.0(2020-03-08)
- 解析UTC格式的日期
- 添加一些日志
- 将id添加到Paste()
v0.5.2(2020-03-09)
- 清理
- 项目
标签: