用于spider的实用程序,如中间件、管道、通用设计实现等

spider-common的Python项目详细描述


十字轴通用

python spider中使用的通用代码。

更改日志

CHANGELOG

项目结构

  • 常见用途

    通用全局函数

  • 提示

    clue(爬虫线索)模块

  • 通知

    事件、信号通知

  • 持久性

    通用数据模型

    抓取数据持久化

代码结:

├── clue
│   ├── api.py
│   ├── constants.py
│   ├── __init__.py
│   ├── models.py
│   └── scrapy
│       ├── extensions.py
│       ├── __init__.py
│       ├── items.py
│       ├── middlewares.py
│       ├── pipelines.py
│       └── spider.py
├── common_utils
│   ├── exceptions.py
│   ├── __init__.py
│   └── time.py
├── __init__.py
├── notify
│   ├── constants
│   │   ├── __init__.py
│   │   └── signals.py
│   ├── __init__.py
│   ├── __pycache__
│   └── scrapy
│       ├── extensions
│       │   ├── __init__.py
│       │   └── signal_handler.py
│       └── __init__.py
├── persistent
│   ├── __init__.py
│   ├── items
│   │   ├── base.py
│   │   ├── __init__.py
│   │   └── shop.py
│   └── scrapy
│       ├── dw_logger.py
│       ├── __init__.py
│       └── pipelines
│           ├── dw_pipeline.py
│           ├── __init__.py
│           └── mysql_pipeline.py

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java SUN次要代码309含义   java避免为空元素生成XML自关闭标记,并生成自定义的<XML>开始标记   java使用json和restful将数组数据从本地sqlite数据库插入SQL Server   java Spring Boot 1.5.9字符编码问题   LInkedIn讨论中的java 401错误   位图Java:检查多个位向量/位集是否相交的最快方法?   macos如何让Java应用程序以图标出现在Mac OS X dock中   java如何删除netbeans中的@SuppressWarnings(“未使用的”)?   apachestorm中的java自定义序列化   java可以退出代码还是应该终止main?   递归如何在Java中递归地绘制简单的线条?   unicode在Java中确定特定字体是否可以呈现特定字符   打开并阅读带有Selenium/Katalon(Java)特定标题的电子邮件文本(来自Gmail)