Scrapy python错误 - 请求URL缺少方案 - 问答

Scrapy python错误 - 请求URL缺少方案

2024-06-28 11:15:43 发布

男 | 程序猿一只，喜欢编程写python代码。

我试图从受密码保护的FTP服务器中提取文件。这是我使用的代码：

import scrapy
from scrapy.contrib.spiders import XMLFeedSpider
from scrapy.http import Request
from crawler.items import CrawlerItem

class SiteSpider(XMLFeedSpider):
    name = 'site'
    allowed_domains = ['ftp.site.co.uk']
    itertag = 'item'

    def start_requests(self):
        yield Request('ftp.site.co.uk/feed.xml',
            meta={'ftp_user': 'test', 'ftp_password': 'test'})

    def parse_node(self, response, selector):
        item = CrawlerItem()
        item['title'] = (selector.xpath('//title/text()').extract() or [''])[0]      
        return item

这是我得到的回溯错误：

^{pr2}$

Tags： from test import self request def site ftp

1条回答

网友

1楼 · 发布于 2024-06-28 11:15:43

您需要为URL添加方案：

ftp://ftp.site.co.uk

FTP URL语法定义为：

^{pr2}$

基本上，你要这样做：

yield Request('ftp://ftp.site.co.uk/feed.xml', ...)

在Wikipedia上阅读更多关于模式的信息：http://en.wikipedia.org/wiki/URI_scheme

Scrapy python错误 - 请求URL缺少方案

相关问题更多 >

编程相关推荐

热门问题

热门文章

Scrapy python错误 - 请求URL缺少方案

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >