scraping简单页面：scrapy不返回所有链接

2024-09-29 08:29:57 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试使用scrapy对以下页面进行爬网：http://www.t13.cl/home/d_ultimas/10。我用

class T13(CrawlSpider):
    name = 't13'
    allowed_domains = ["http://www.t13.cl"]
    start_urls = ['http://www.t13.cl/home/d_ultimas/10']

    rules = (
        Rule(LinkExtractor(allow=(r'.')),
             callback='parse_item'),
    )

    def parse_item(self, response):
        pass

但它只返回一个链接（第一个链接）。为什么它不遵循该页面中的所有<a>链接？（如果我使用shell，它会返回所有选择器）

Tags： name http home parse 链接 cl www 页面

1条回答

网友

1楼 · 发布于 2024-09-29 08:29:57

看起来您的请求正在被allowed_domains筛选。更改为：

allowed_domains = ["t13.cl"]

scraping简单页面：scrapy不返回所有链接

相关问题更多 >

编程相关推荐

热门问题

热门文章

scraping简单页面：scrapy不返回所有链接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >