ValueError:python中的请求url:h中缺少方案

2024-10-01 11:38:45 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的代码,我试图从这个网站访问一个评论,但显示了一个错误。在

class DomainCrawlSpider(BaseSpider):
    name = "Spider"
    allowed_domains = ["www.smahavarkar.wordpress.com"]
    start_urls = "http://smahavarkar.wordpress.com/"

    def parse(self, response):
        hxs = HtmlXPathSelector(response)
        titles = hxs.select("//p")
        items = []
        for titles in titles:
            item = DItem()
            item ["address"] = titles.select("a/text()").extract()
            item ["review1"] = titles.select("p/text()").extract()
            item.append(item)
        return item

Tags: 代码textcom网站response错误评论wordpress
2条回答

start_urls更改为:

start_urls = ("http://smahavarkar.wordpress.com/",)

它对我有用。在

start_urls应该是一个列表,请尝试更改为:

start_urls = ["https://www.zomato.com/cs/mumbai/restaurace?q=pop%20tates"]

相关问题 更多 >