Scrapy MapCompose:如何使用w3lib remove_标记和keep=()选项?

2024-10-06 10:32:51 发布

您现在位置:Python中文网/ 问答频道 /正文

下面的默认输出处理器工作正常,但我只想保留“p”标记

l.default_output_processor = MapCompose(lambda v: v.strip(), replace_escape_chars, remove_tags)

如何添加keep=('p',)选项,例如remove_tags(text, keep=('p',))?在MapCompose语句中“text”应该是什么?或者应该如何做到这一点?我找不到一个例子


Tags: lambdatext标记defaultoutputtags处理器processor
1条回答
网友
1楼 · 发布于 2024-10-06 10:32:51

您可以定义一个新函数,例如

def remove_p_tags(value):
    return remove_tags(value, which_ones=('p',)).strip()

然后将该函数添加到MapCompose()中

相关问题 更多 >