从命令行向废规则传递参数或动态修改规则

1条回答

网友

1楼 · 发布于 2024-09-30 08:35:15

幸运的是它工作了，在How to dynamically set Scrapy rules?找到了答案

这是工作代码

class DmozSpider(CrawlSpider):

  name = "myCrawler"

   def __init__(self, allowedDomains='', startUrls='',allowedPaths='', *args, **kwargs):
       super(DmozSpider, self).__init__(*args, **kwargs)
       self.allowedDomains = allowedDomains
       self.startUrls = startUrls
       self.allowedPaths = allowedPaths
       self.allowed_domains = [allowedDomains]
       self.start_urls = [startUrls]
       DmozSpider.rules = (Rule(LinkExtractor(allow=(allowedPaths), allow_domains=allowedDomains), callback="parse_items",
                     follow=True),)
       super(DmozSpider, self)._compile_rules()

编程相关推荐

电子邮件Java mail，无法读取outlook客户端发送的“.msg附件”
java对Spring数据的条件查询JPA在DB2（z/OS）上给出了一个417错误
java TimerTask异常
从安卓应用程序向linkedIn发送带有文本的java post图像
java无法从EditText中获取文本
关于重复的Java初学者
java Hibernate未在CriteriaUpdate中调用nullvalue的用户类型
安卓 java。lang.IllegalStateException MediaPlayer
java如何在多种情况下使用IgnoreCase
java如何在使用程序时不让用户使用0？

相关问题更多 >

编程相关推荐

热门问题

热门文章

从命令行向废规则传递参数或动态修改规则

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >