Python Scrapy是配置scraper的常用方法

class SpiderConfigurator: def __init__(): ... def configureSpider(spider, environment): ... spider.setMyCustomSettings(arg1, arg2) ... environment.setMyCustomSettings(argName1, argValue1) environment.setMyCustomSettings('User-Agent', 'my value')

1条回答

网友

1楼 · 发布于 2024-10-04 05:26:54

Scrapy允许从脚本中拖拽：Run Scrapy from script感谢@paultrmbrth的提示

但是我们不能初始化spider-我们只是将spider类传递给Crawler实例，然后crawler实例化对象。我们能做的是——为spider的构造函数传递参数。Smth是这样的：

os.chdir(scrapyDir)
projectSettings = get_project_settings()
crawlerProcess = CrawlerProcess(projectSettings)
crawlerProcess.crawl(SpiderCls,
                     argumentName1=argumentValue1,
                     argumentName2=argumentValue2)

参数argumentName1和argumentName2将传递给spider的构造函数

编程相关推荐

java通过EventListener更新Hibernate实体
java将每个组合按字母顺序排列
java找不到媒体类型为application/xml+fhir的JAXBContextFinder
java ReactiveCrudePository与R2DBCrudePository
java如何在对arraylist执行某些操作后更新它而不重新启动活动
在NetBeans中，如何更改默认的JDK？
web服务轴心：获取java。RuntimeException:java。lang.UnsupportedClassVersionError:中的版本号不正确。类文件
为一个Atribut java设置多个值以筛选附加列表
如何将参数从jsp传递到java类？
opencv_contrib对java Maven的依赖

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python Scrapy是配置scraper的常用方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >