我正在努力搜刮一个网站。我需要一个产品的名称和它的参考。我正在抓取的html是:
<li>
<a href="wensite?area=areacode" class="dropdown-element" data-code="areacode" style="cursor: pointer;">Name of the item</a>
spider需要生成一个包含产品名称及其区号的元组。目前,我可以使用folling Xpath选择器“//li/a[@href]/text()”刮取项目名称,但我不知道如何同时生成区域码。你知道吗
谢谢你的帮助
尝试使用此xpath表达式来清除区号
要同时获取区号和项目名称,请尝试以下表达式:
试试这个。这将给您一个
[Name, AreaCode]
格式的列表response.css('dropdown-element ::text, dropdown-element ::attr(data-code)').getall()
相关问题 更多 >
编程相关推荐