Scrapy日志显示页面已爬网，但找到0个对象。当用ScrapyShell完成它的工作，但当我导出结果时，这种情况发生了

2024-10-05 14:24:29 发布

您现在位置：Python中文网/ 问答频道 /正文

1956

网友

男 | 程序猿一只，喜欢编程写python代码。

我刮this我刮这个链接为不同的领域不同，但一旦我在一个刮项目没有工作

这是我的蜘蛛文件代码：

import scrapy
from pubg.items import MemberItem
from scrapy.loader import ItemLoader
from scrapy.loader.processors import TakeFirst

class Pubg_spider(scrapy.Spider):
    name="pubgspider"
    start_urls = ["https://forums.pubg.com/leaderboard/"]

    def parse(self, response):

        job_list =response.css('div.row')

        for job in job_list:
            job_loader = ItemLoader(MemberItem(), selector=job)
            job_loader.default_output_processor=TakeFirst()
            job_loader.add_css('Upload_Date','time::text')
            job_loader.add_css('Source','.ipsType_reset.ipsStreamItem_title.ipsContained.ipsType_break > a::attr(href)')
            job_loader.add_css('Headline','.ipsType_reset.ipsStreamItem_title.ipsContained.ipsType_break > a::text')
            job_loader.add_css('Content','.ipsType_richText.ipsContained.ipsType_medium > div > div::text')
            job_loader.add_css('Vote','.cPopularItem_stats.ipsType_center::text')
            yield job_loader.load_item()

我的管道文件如下所示：

class PubgPipeline(object):
def process_item(self, item, spider):
    try:
        item['Upload_Date']
    except KeyError:
        item['Upload_Date'] = 'N/A'
    try:
        item['Source']
    except KeyError:
        item['Source'] = 'N/A'
    try:
        item['Headline']
    except KeyError:
        item['Headline'] = 'N/A'
    try:
        item['Content']
        item['Content']=''.join(c for c in item['Content'] if c not in '\r\t\n')
    except KeyError:
        item['Content'] = 'N/A'
    try:
        item['Vote']
        item['Vote']=''.join(c for c in item['Vote'] if c not in '\r\t\n')
    except KeyError:
        item['Vote'] = 'N/A'
    return item

我是一个初学者，在这两个scrapy和stackoverflow，所以一定要提到任何错误

Tags： text in import add job loader content item

1条回答

网友

1楼 · 发布于 2024-10-05 14:24:29

您可以从spider方法使用self.logger.debug(<string or variable>)，或者从spider管道方法使用spider.logger.debug()

有关详细信息，请参阅Debugging Spiders

Scrapy日志显示页面已爬网，但找到0个对象。当用ScrapyShell完成它的工作，但当我导出结果时，这种情况发生了

相关问题更多 >

编程相关推荐

热门问题

热门文章

Scrapy日志显示页面已爬网，但找到0个对象。当用ScrapyShell完成它的工作，但当我导出结果时，这种情况发生了

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >