刮花蜘蛛的api

Arachne的Python项目详细描述


https://travis-ci.org/kirankoduru/arachne.svghttps://coveralls.io/repos/kirankoduru/arachne/badge.svg?branch=master&service=github

arachne为您的scrapySpider对象提供了一个包装器,用于通过flask应用程序运行它们。您只需在设置文件中自定义SPIDER_SETTINGS

安装

您可以从pip安装arachne

pip install Arachne

示例设置

这是项目中蜘蛛的示例设置文件。设置文件应该被称为settings.py,以便arachne找到它,如下所示:

# settings.py file
SPIDER_SETTINGS = [
        {
                'endpoint': 'dmoz',
                'location': 'spiders.DmozSpider',
                'spider': 'DmozSpider'
        }
]

用法

它看起来非常类似于flask应用程序,但是由于scrapy依赖于python twisted包,因此我们需要使用twisted运行flask应用程序

from twisted.web.wsgi import WSGIResource
from twisted.web.server import Site
from twisted.internet import reactor
from arachne import Arachne

app = Arachne(__name__)

resource = WSGIResource(reactor, reactor.getThreadPool(), app)
site = Site(resource)
reactor.listenTCP(8080, site)

if __name__ == '__main__':
        reactor.run()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
API调用时返回java Null   JavaJAXB:如何从嵌套元素中检索文本属性?   java如何在Windows机器上用Maven创建Dockerfile,然后发送到远程Linux服务器以构建映像,然后运行?   并行处理集群java独立应用程序   java使用POST将图像上传到服务器   分发组的java JavaMail/Exchange AuthAs标头   swing Java JScrollPane多个组件   JAXB将XML文档映射到Java对象   java如何在JDK中实现OpenCSV CSVReader,我正在使用VSC代码   基于屏幕大小的java翻译动画   在java中比较堆栈元素和对象的搜索   java如何在Swing中更改化身?   java JAXB将1个XML标记映射到2个变量   java面试问题:递归生成素数的最快方法是什么?   JavaEclipseIDE频繁关闭   Java中从像素读取RGB值的图像   通过查询oracle DB列值获得的字符串中的java转义XML特殊字符   java从ArrayList中删除多个项