一个小型网络爬虫pastebin.com网站网站

simple-pastebin-parser的Python项目详细描述


https://travis-ci.com/shlomikushchi/Simple-Pastebin-Parser.svg?branch=master

简单的Pastebin解析器

这是用于pastebin.com网站网站。在

它将迭代posts并使用lxml解析它们的元素

安装:

pip安装简单的pastebin解析器

示例用法

importsimple_pastebin_parserforpasteinsimple_pastebin_parser.get_pastes():print("Title: ",paste.Title)print("Author: ",paste.Author)print("date: ",paste.Date)print("Content: ")print(paste.Content)print("*"*20)

发行说明:

v0.1.0-P.O.C.

概念的初步证明。没什么特别的,只是在做解析帖子的脏活。在

如何执行: 1创建Python3.6的虚拟环境 2安装要求 三。运行pythonpoc.py公司在

v0.2.5(2020-03-07)

  • 集成特拉维斯.ci在

v0.2.6(2020-03-07)

  • 更改POC代码以使用已安装的pypi包

v0.3.0(2020-03-07)

  • 为pastebin posts创建了Paste()对象
  • 数据流的能力

v0.3.3(2020-03-07)

  • 小修小补

v0.3.5(2020-03-07)

  • 更新自述

v0.4.0(2020-03-08)

  • 添加的文档
  • 清除了大多数pep8问题
  • 一些测试

v0.5.0(2020-03-08)

  • 解析UTC格式的日期
  • 添加一些日志
  • 将id添加到Paste()

v0.5.2(2020-03-09)

  • 清理

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用java在mysql中使用外键插入到表中   java Android按类别筛选列表   java对JGoodies外观的更改   java如何在Drools规则中推断中间值   用于虚拟拆分文本文件的java解决方案   使用XML的java Android UI(Android和XML)   使用ApachePOI库将工作表适配到xlsx文件中的单个页面时遇到的java问题   java类型为javafx。fxml。FXMLLoader不可访问(vscode)   java所有计划的作业都在运行,即使提到了节点id   java将大整数打印到文本文件   java让正则表达式忽略新行,只匹配整个大字符串?   java图形库   CardLayout的java替代品,不包含对所包含组件的引用   个人Android应用程序的java包名称   java 安卓写入文件不会写入任何内容   每次加载页面gest后,java Xpath都会发生变化   java动态地向FlipperView添加文本视图,并使用不同的滚动方式   java如何将新类映射到实体中的现有类?   ffmpeg无法将命令参数传递给外部。Java调用的exe应用程序