cabu是一个简单的rest微服务,可以从任何地方丢弃内容。

cabu的Python项目详细描述


cabu

Documentation Status

cabu是一个简单的微服务框架,用于远程抓取网站。 它基于flask和selenium构建,包含一个虚拟显示包装器和一些方法。

Full documentation here

用法

@app.route('/gizmodo_last_articles_links')defgizmodo_last_articles():app.webdriver.get('http://www.gizmodo.com')articles_links=[i.get_attribute('href')foriinapp.webdriver.find_elements_by_css_selector('h1.headline>a')]returnjsonify({'articles':articles_links})

安装

$ pip install cabu

功能

  • 硒配置开箱即用
  • 烧瓶包装
  • 包括爬网方法
  • AWS S3出口
  • ftp/ftps
  • cookies持久性
  • 链接提取程序
  • 代理配置
  • 本地调试的无头选项
  • Docker预先配置的分布式环境
  • 数据库处理程序
  • 与大多数烧瓶扩展兼容(烧瓶管理、烧瓶邮件、烧瓶OAuth…)
  • 12个因素合规性

(可能很快就到)

  • couchdb支持
  • Couchbase支持
  • 移动驱动程序
  • SFTP
  • htmlUnit Web驱动程序
  • 远程webdriver包装器
  • 并行化
  • 神经网络插件

测试

所有测试都是用Docker服务而不是Mock编写的。 很快将添加替代模型;)

$ pip install -r requirements-dev.txt
$ py.test cabu/tests

贡献

请看Contribute page

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java HttpClient:禁用分块编码   java在Junit 4中构建测试套件   安卓 studio活动之间的java进度条   java从云Firestore获取地图数据   AmazonWebServices为什么JavaWebSocket服务器这么慢?   java My代码违反了DRY原则,但不确定如何进行重构   java在Eclipse动态Web项目中包含HTML文件   java检查首次启动安卓时是否在活动上单击了按钮   用@XmlElementRef注释的java元素没有显示在JAXB编组字符串中?   线程“main”java中的eclipse异常。lang.ClassNotFoundException:oracle。jdbc。OracleDriver Jdbctype4test。类型4测试。main(Type4test.java:21)   java如何将表单数据从HTML提交到某人的Skype帐户   java如何使用图形“g”?   java构建文件不是gradle中设置文件定义的构建的一部分   java用迭代优化HashMap   java在jsp中使用jstl访问结果集   java实现OOP中的等式优先度   java ChromeDriver组织。openqa。硒。遥远的协议握手会话   用Java程序读取Java的属性文件   java TabHost和Fonthouse图标   在Java中将灰度转换为颜色渐变?