我试图像下面这样解析html:
<tbody>
<tr class data-row="0">
<td align="right"></td>
</tr>
<tr class data-row="1">
<td align="right"></td>
</tr>
<tr class="thead over_theader" data-row="2">
<td align="right"></td>
</tr>
<tr class="thead" data-row="3">
<td align="right"></td>
</tr>
<tr class data-row="4">
<td align="right"></td>
</tr>
<tr class data-row="5">
<td align="right"></td>
</tr>
</tbody>
我想获得所有未指定tr
标记(及其子标记)。对于上面的例子,这意味着我想要tr
标记,其中data-row
不是2或3。在
我怎么用靓汤4来做这个?在
我试过了
^{pr2}$但是当我想要一个长度为4的bs4.element.ResultSet
时,它返回了一个长度为8的类型bs4.element.ResultSet
(即,它包含了带有td
标记的tr
子元素),而此时我需要一个长度为4的tr
标记和{
默认情况下,
find_all
将递归搜索。因此,td
标记是有效的匹配项。在Docs:
所以你可以写,例如:
输出:
^{pr2}$当我指定
tr
标记名时,您的方法实际上对我有效:{{cd2}也可以使用{cd2}:
^{pr2}$相关问题 更多 >
编程相关推荐