Xpath碎片结果不符合预期

... <tr class="destaque no-hover"> <td class="periodo" colspan="6">2020.1</td> </tr> <tr class="linhaPar"> <td>Text1</td> <td align="center">01</td> <td align="right">312h</td> <td align="center">3T12</td> </tr> <tr class="linhaImpar"> <td>Text2</td> <td align="center">01</td> <td align="right">12h</td> <td align="center">5M12</td> </tr> ... <tr class="destaque no-hover"> <td class="periodo" colspan="6">2016.1</td> </tr> <tr class="linhaPar"> <td>Text7</td> <td align="center">01</td> <td align="right">2h</td> <td align="center">2N12</td> </tr> <tr class="linhaImpar"> <td>Text8</td> <td align="center">01</td> <td align="right">32h</td> <td align="center">4T12</td> </tr> ... <tr class="destaque no-hover"> <td class="periodo" colspan="6">2014.2</td> </tr> <tr class="linhaPar"> <td>TextN-1</td> <td align="center">01</td> <td align="right">2h</td> <td align="center">2N12</td> </tr> <tr class="linhaImpar"> <td>TextN</td> <td align="center">01</td> <td align="right">32h</td> <td align="center">4T12</td> </tr>

# I've tried this, but return a list of elements that matches, not the close one, as I want _p = _aux.xpath('./preceding::tr[td[@class="periodo"]') # I've also tried this, but won't work _p = _aux.xpath('./preceding::tr[td[@class="periodo"] and position()=1]')

_p = "" for i in response.xpath('//tr[@class="linhaPar" or @class="linhaImpar" or @class="destaque no-hover"]'): # Check if it's a td with period if 'destaque no-hover' == i.xpath('./@class').get(): _p = i.xpath('./td/text()').get() continue # Force to go to the next one

2条回答

网友
1楼 · 编辑于 2024-09-25 08:37:04

此XPath：
'//tr[@class="linhaPar" or @class="linhaImpar" or td[@class="periodo"]]'

网友
2楼 · 编辑于 2024-09-25 08:37:04

假设您希望将其存储在_p（每个tr上下文节点一个periodo）：
['2020.1'], ['2020.1'], ['2020.1'], ['2020.1']
使用：
./preceding::td[@class="periodo"][1]
假设您希望将其存储在_p（每组数据一个periodo）：
['2020.1'], [], ['2020.2'], []
使用：
./preceding-sibling::tr[1]/td[1][@class="periodo"]
如果需要从创建的列表中删除空元素，请在之后使用filter进行删除
对于第二种情况，正如@Gilles Quenot所述，您还可以为以下内容更改上下文节点：
//tr[@class="linhaPar" or @class="linhaImpar" or @class="destaque no-hover"]
并在列表中填写：
_aux = ./td[1][not(@class="periodo")] _p = ./td[1][@class="periodo"]
或：
_aux = ./td[1][not(starts-with(text(),"2020."))] _p = ./td[1][starts-with(text(),"2020.")]

相关问题更多 >

编程相关推荐

热门问题

热门文章