如何在刮页时删除\r\n?

2024-10-05 17:47:28 发布

您现在位置:Python中文网/ 问答频道 /正文

我创建了一个函数,通过抓取一个页面并运行,但是输出给出了\r\n。我使用strip函数来删除\r\n,但它不起作用。为什么以及如何删除\r\n? 这里是链接:https://ibb.co/VtVV2fb

import scrapy
from .. items import FetchingItem

class SiteFetching(scrapy.Spider):
    name = 'Site'
    start_urls = ['https://www.rev.com/freelancers']
    transcription_page = 'https://www.rev.com/freelancers/transcription'

    def parse(self, response):
        items = {
            'Heading': response.css('#sign-up::text').extract(),
            'Earn_steps': response.css('.pb2 .lh-copy::text , .mb1::text , .mb3 .lh-copy::text').extract(), 
    }

        yield response.follow(self.transcription_page, self.trans_faqs, meta={'items':items})

    def trans_faqs(self, response):
        items = response.meta['items']
        names = {
            'name1': 'FAQ1',
            'name2': 'FAQ2', 
        }
        finder = {
            'find1': '#whatentailed p::text , #whatentailed .mr3::text',
            'find2': '#requirements p::text , #requirements .mr3::text'
        }
        for name, find in zip(names.values(), finder.values()):
            items[name] = list(map(str.strip,response.css(find).extract()))
        yield items

Tags: 函数textnamehttpsimportselfresponsewww
1条回答
网友
1楼 · 发布于 2024-10-05 17:47:28

每当我有一个带制表符或换行符的字符串时,我发现用“”替换它们对我很有用。你知道吗

例如,如果字符串变量中同时有\t和\n,则可以执行以下操作:

string_variable.replace('\n','').replace('\t','')

到目前为止效果不错。你知道吗

相关问题 更多 >