基于asyncio的异步python 3.6+web抓取微框架。

ruia的Python项目详细描述


traviscodecovPyPI - Python VersionPyPIDownloadsgitter

概述

ruia是一个异步web抓取微框架,用asyncioaiohttp编写, 目的是使抓取网址尽可能方便。

写更少,运行更快

功能

  • easy:声明式编程
  • fast:由异步供电
  • 可扩展:中间件和插件
  • 强大的:javascript支持

安装

# For Linux & Mac
pip install -U ruia[uvloop]# For Windows
pip install -U ruia

# New features
pip install git+https://github.com/howie6879/ruia

教程

  1. Overview
  2. Installation
  3. Define Data Items
  4. Spider Control
  5. Request & Response
  6. Customize Middleware
  7. Write a Plugins

待办事项

  • 用于调试的缓存,以减少请求限制
  • 分布式爬网/抓取

贡献

ruia仍在开发中,请随时提出问题和请求:

  • 报告或修复错误
  • 需要或发布插件
  • 编写或修复文档
  • 添加测试用例

啊!!!注意:我们使用black来格式化代码

谢谢

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JAVA Tictoe Minimax算法不断引发异常   java弹性时间计算器字符串开关   java从表单post操作中检索值   java Selenium webdriver无法在youtube上找到元素   java如何自动填写XFA(PDF)表单?   java为什么我的秒表程序不能运行?   raspberry pi禁用java中的其他声音   java如何配置web。xml,glassfishweb。JSF的xml文件?   使用浏览器运行自动测试时出现java错误。如何运行它?   java如何阻止Swing程序在每次向JTextArea添加文本时调整组件的大小   javajavax。注射注射无效   java如何改进Solaris服务器配置   java如何在elasticsearch后端脱机时处理Hibernate搜索启动   java TCPsocket的延迟很差,除非持续流式传输