Frontera的ScrapyCLOUD Hubstorage Frontier后端

hcf-backend的Python项目详细描述


Frontera的HCF(Hubstorage Crawl Frontier)后端

与scrapy一起使用时,请与由scrapy-frontera提供的scrapy调度程序一起使用。提供垃圾调度程序 不支持byFronterascrapy frontera是一个允许使用frontera后端的scrapy调度程序, 就像现在的那个,有一些零碎的项目。

请参阅位于backend.py的模块和类docstrings中的特定用法说明。 在scrapy-frontera README中可以看到一些用法示例。

有关在scrapyCLOUD工作流中使用hcf-backend的完整教程,请访问 shub-workflow Tutorialshub-workflow是定义蜘蛛工作流的框架 以及运行在scrapycloud上的脚本。这是一个强烈推荐的讲座,因为它记录了不同工具的集成,这些工具一起提供 最好的好处。

包还提供了一个方便的命令行工具,用于hubstorage前沿处理和操作: hcfpal.py。它支持转储、计数、删除、移动、列出等。 有关用法,请参见命令行帮助。

提供的另一个工具是crawlmanager.py。它有助于 消费者蜘蛛作业。前面提到的shub-workflow教程中也提供了使用示例。

安装

pip install hcf-backend

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Split方法在Java数组中创建空元素   多线程java多线程读取。。请帮助我,我对java非常陌生:(   调整大小时,java jpanel与jdesktop窗格不匹配   java JDBC/MYSQL通信链路故障(ECLIPSE/ANDROID)   java Android应用程序登录和注册错误   同一行上多次字符串之间的Java正则表达式   java为什么Spring在混淆之后看不到我的@Resource注释对象?   java Javafx:解析命名空间中不存在的onAction//eventHandler时出错   Java中的“原始接口方法”是什么?   apache如何在使用httpClent java上传时取得进展   java如何设计我的setter方法?   java可以在使用Iterable迭代元素时更改元素。forEach(消费者)?   java组织。openqa。硒。ElementNotVisibleException   使用JAXRS和OData的java REST服务?