Python sbcrawler包_程序模块 - PyPI

轻型履带

sbcrawler的Python项目详细描述

sbcrawler

light weight crawler

轻量级的爬虫框架sbcrawler

写这个框架的动机

平时写爬虫过程中，发现通常不需要什么高大上的异步、并发、分布式等功能。
小需求对防止被封，中断继续，日志进度等方面有更多重复性的代码。
sbcrawler就是实现一个最简单的爬虫框架，让你可以专注于写内容抽取逻辑。

特点

单进程，非异步
断点续爬
错误日志记录

用法示例

# -*- coding: utf-8 -*-fromsbcrawlerimportCrawlerclassMyCrawlerExample(Crawler):start_url="https://xxx.xxx.com/xxx/"# 起始种子urlallowed_domain="https://xxx.xxx.com/"# 限制域,要带httpdefextract_links(self,html,task):# 抽取链接 加到爬取任务列表iftask.depth==0ortask.depth==1:html=html.find('.module_summary',first=True)iftask.depth==2:html=html.find("#in_list_main > table > tr:nth-child(6)",first=True)iftask.depth==3:returnsuper().extract_links(html,task)defextract_content(self,html,task):iftask.depth==3:title=html.find('#title',first=True)article=html.find('#article',first=True)return{'title':title.full_text,'article':article.full_text}if__name__=="__main__":crawler=MyCrawlerExample()crawler.start()

安装

pip install git+https://github.com/ffteen/sbcrawler.git

欢迎加入QQ群-->： 979659372

sbcrawler 0.1.2

sbcrawler的Python项目详细描述

sbcrawler

写这个框架的动机

特点

用法示例

安装

推荐PyPI第三方库

tormdb

mishkal

tagup

mazepa

odoo13-addon-apps-product-creator

odoo12-addon-purchase-default-terms-conditions

quantbacktest

napalm-opengear

take-a-break

salesvision

jsa-auth-middleware

yaqd-microchip

food-alerts-wrapper

xmatrix

tapcode

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

sbcrawler 0.1.2

sbcrawler的Python项目详细描述

sbcrawler

写这个框架的动机

特点

用法示例

安装

推荐PyPI第三方库

tormdb

mishkal

tagup

mazepa

odoo13-addon-apps-product-creator

odoo12-addon-purchase-default-terms-conditions

quantbacktest

napalm-opengear

take-a-break

salesvision

jsa-auth-middleware

yaqd-microchip

food-alerts-wrapper

xmatrix

tapcode

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签