如何使用Scrapy和Xpath刮取多个元素?

2024-09-29 23:24:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在努力搜刮一个网站。我需要一个产品的名称和它的参考。我正在抓取的html是: <li> <a href="wensite?area=areacode" class="dropdown-element" data-code="areacode" style="cursor: pointer;">Name of the item</a>

spider需要生成一个包含产品名称及其区号的元组。目前,我可以使用folling Xpath选择器“//li/a[@href]/text()”刮取项目名称,但我不知道如何同时生成区域码。你知道吗

谢谢你的帮助


Tags: 名称data产品网站stylehtmlcodearea
3条回答

尝试使用此xpath表达式来清除区号

//li/a/@data-code

要同时获取区号和项目名称,请尝试以下表达式:

//li/a[@href]/(@data-code,text())/string()

试试这个。这将给您一个[Name, AreaCode]格式的列表

response.css('dropdown-element ::text, dropdown-element ::attr(data-code)').getall()

相关问题 更多 >

    热门问题