面向人类的智能代理池™
scylla的Python项目详细描述
一个用于人文学科的智能代理池,只支持Python3.6。主要功能:
- 自动代理IP爬网和验证
- 易于使用的json api
- 简单但漂亮的基于网络的用户界面(如地理位置 代理的分布)
- 只使用1命令开始最少
- 简单的http转发代理服务器
- Scrapy和requests集成,最少只有一行代码
- 无头浏览器爬网
中新网
文档
请阅读Documentation。
快速启动
安装
使用Docker安装(强烈推荐)
docker run -d -p 8899:8899 -p 8081:8081 -v /var/www/scylla:/var/www/scylla --name scylla wildcat/scylla:latest
直接通过PIP安装
pip install scylla
scylla --help
scylla # Run the crawler and web server for JSON API
从源安装
git clone https://github.com/imWildCat/scylla.git cd scylla pip install -r requirements.txt npm install # or yarn install make assets-build python -m scylla
对于由于uvloop does not support Windows at the moment:
exportSANIC_NO_UVLOOP=trueexportSANIC_NO_UJSON=true pip3 install sanic
如果这也失败了,yoi将需要从源代码手动安装sanic。
路线图
请看Projects。
发展与贡献
git clone https://github.com/imWildCat/scylla.git cd scylla pip install -r requirements.txt npm install # or `yarn install` make assets-build
测试
如果要在本地运行测试,命令如下所示:
pip install -r tests/requirements-test.txt pytest tests/
欢迎您向这个项目添加更多的测试用例,从而提高这个项目的健壮性。
本项目命名
Scylla是从美国电视剧Prison Break中的一组存储芯片的名称派生而来的。这个项目是以这部美国电视连续剧命名的,以表达对它的敬意。
许可证
apache许可证2.0。有关详细信息,请阅读 LICENSE文件。