废料输入过程

2024-10-06 10:28:09 发布

您现在位置:Python中文网/ 问答频道 /正文

在项目.py公司名称:

import scrapy
from scrapy.loader.processors import MapCompose

def filter_spaces(value):
    return value.strip(" ").strip("\n")

class LotItem(scrapy.Item):
    num = scrapy.Field(input_processor=MapCompose(filter_spaces))

在蜘蛛网.py公司名称:

^{pr2}$

response.xpath('//div/span/text()').extract()[0]返回一种

"\n1234     "

我需要把它变成:"1234"

但我还是得到了形式-{'num': '\n1234 '}的对象

非常感谢!!!在


Tags: 项目frompyimport名称value公司loader
1条回答
网友
1楼 · 发布于 2024-10-06 10:28:09

你可以用响应.xpath使用正则表达式而不是extract()。像这样的号码:

response.xpath("//div/span/text()").re(r"(?:'num':\s'\\n)([0-9]*)(?:\s*')")

或者像这样的城市:

^{pr2}$

(所有正则表达式都未经测试,可能需要稍作调整。)

相关问题 更多 >