javajsoup:提取内部标记
我有很多这样的代码块:
<tr>
<td headers="header1"><b><a href="www.site.com">TITLE</a></b></td>
<td headers="header2"><ul class="list_attachments">
<li><a href="/"><img src='/img/fileicons/pdf.png' alt='pdf'/>A</a>
</li><li><a href=""><img src='/img/fileicons/pdf.png' alt='pdf'/> B</a>
</li></ul></td><td headers="header3" class="centrato">DATE</td></tr>
<tr>
为了在所有这些块中进行迭代,我尝试:
Elements elements = document.select("tr").select("td[headers=header1]");
此命令有效,但仅限于选择
<td headers="header1"><b><a href="www.site.com">TITLE</a></b></td>
而不是整个街区。我该怎么解决这个问题?不能说:“jsoup,请选择所有具有内部
# 1 楼答案
为了完成选择包含内部
<td headers="header1">
的所有<tr>
块的任务,我提出以下解决方案