我想抓住一个特定的链接。我的问题是,该链接是在没有特定标记的单元格中标识的。例如:
<td class="tableText" style="padding-left: 10px;">
<a href="/link">John</a>;
<a href="/link">Jacob</a>; (Primary) <br/>
<a href="/link">Jingle</a>;
<a href="/link">Bud</a>;
</td>
基本上,我只想抓取标记为“Jacob”的链接,通过它后面的文本(“Primary”)标识。在本例中,我的代码如下所示:
item['stuff'] = response.xpath('//div[@id = "mainBody"]/table/tr/td/a/text()').extract()
在这种情况下,我希望scrapy得到一个**[2]**。你知道吗
您可以使用
following-sibling
轴执行此操作:相关问题 更多 >
编程相关推荐