我有一个这些<TD>
的列表,并使用列表理解来一次获得它们。
希望在两种情况下都提取文本“v11/4”,即有/无sup
必须提取到单个元素中(对于此行)。你知道吗
例1
<td>
<b class="black">2</b>/6 <a href="/some/link"onclick=
"returnHtml.popup(this," title="whateveryoulike">(ABL TTTTTSSSSSS
11)</a>v 11/4</td>
例2
<td>
<b class="black">2</b>/6 <a href="/some/link"onclick=
"returnHtml.popup(this," title="whateveryoulike">(ABL TTTTTSSSSSS
11)</a>v<sup>1</sup> 11/4</td>
有什么想法吗?你知道吗
识别文本“v11/4”的一种可能的方法是将位于
<a>
'之后的所有直接子文本节点(属于<td>
)串联起来。下面是使用lxml.html
的示例实现:相关问题 更多 >
编程相关推荐