用于spider的实用程序,如中间件、管道、通用设计实现等
spider-common的Python项目详细描述
十字轴通用
python spider中使用的通用代码。
更改日志
项目结构
常见用途
通用全局函数
提示
clue(爬虫线索)模块
通知
事件、信号通知
持久性
通用数据模型
抓取数据持久化
代码结:
├── clue
│ ├── api.py
│ ├── constants.py
│ ├── __init__.py
│ ├── models.py
│ └── scrapy
│ ├── extensions.py
│ ├── __init__.py
│ ├── items.py
│ ├── middlewares.py
│ ├── pipelines.py
│ └── spider.py
├── common_utils
│ ├── exceptions.py
│ ├── __init__.py
│ └── time.py
├── __init__.py
├── notify
│ ├── constants
│ │ ├── __init__.py
│ │ └── signals.py
│ ├── __init__.py
│ ├── __pycache__
│ └── scrapy
│ ├── extensions
│ │ ├── __init__.py
│ │ └── signal_handler.py
│ └── __init__.py
├── persistent
│ ├── __init__.py
│ ├── items
│ │ ├── base.py
│ │ ├── __init__.py
│ │ └── shop.py
│ └── scrapy
│ ├── dw_logger.py
│ ├── __init__.py
│ └── pipelines
│ ├── dw_pipeline.py
│ ├── __init__.py
│ └── mysql_pipeline.py