用于爬行器的API,已针对Novelship进行调整

ArachneStrahi的Python项目详细描述


https://travis-ci.org/kirankoduru/arachne.svghttps://coveralls.io/repos/kirankoduru/arachne/badge.svg?branch=master&service=github

arachne为您的scrapySpider对象提供了一个包装器,用于通过flask应用程序运行它们。您只需在设置文件中自定义SPIDER_SETTINGS

安装

您可以从pip安装arachne

pip install Arachne

示例设置

这是项目中蜘蛛的示例设置文件。设置文件应该被称为settings.py,以便arachne找到它,如下所示:

# settings.py file
SPIDER_SETTINGS = [
        {
                'endpoint': 'dmoz',
                'location': 'spiders.DmozSpider',
                'spider': 'DmozSpider'
        }
]

用法

它看起来非常类似于flask应用程序,但是由于scrapy依赖于python twisted包,因此我们需要使用twisted运行flask应用程序

from twisted.web.wsgi import WSGIResource
from twisted.web.server import Site
from twisted.internet import reactor
from arachne import Arachne

app = Arachne(__name__)

resource = WSGIResource(reactor, reactor.getThreadPool(), app)
site = Site(resource)
reactor.listenTCP(8080, site)

if __name__ == '__main__':
        reactor.run()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java数据源线程执行交易策略?   java Android AsyncTaskLoader未启动loadInBackground?   java试图用clean参数编译Maven,但遇到异常   在java中如何从输入日期获取格式?   java如果用户输入字母而不是数字,告诉他们这不是数字   java flexjson。JSONException不知道如何绑定   java如何限制圆在直线上的拖动。JavaFX   java如何在屏幕上移动/动画单个子类对象而不移动其他子类?   按下后退按钮时禁用java Android按钮   java如何只返回以标点符号结尾的字符串?   java如何在方法上使用控制语句?如果可能的话   java如何将非泛型接口扩展为泛型接口?   java Testng如何在为所有数据提供程序运行测试方法后运行清理代码?