擅长:python、mysql、java
<p>XPath是一种选择语言,因此它可以选择节点。如果输入中有单独的节点,那么您将得到一个单独节点的列表作为选择结果。在</p>
<p>您将需要宿主语言(在本例中是Python)的帮助来完成超出该范围的操作(例如,将文本节点合并为单个字符串)。在</p>
<p>您需要找到所有<code><a></code>元素并连接它们各自的文本子体。这很容易做到:</p>
<pre><code>from lxml import etree
doc = etree.parse("path/to/file")
for a in doc.xpath("//a"):
print " ".join([t.strip() for t in a.itertext()])
</code></pre>
<p>印刷品</p>
^{pr2}$
<hr/>
<p>正如paul在下面的评论中正确指出的那样,您可以使用XPath的<code>normalize-space()</code>,整个过程变得更加简单。在</p>
<pre><code>for a in doc.xpath("//a"):
print a.xpath("normalize-space()")
</code></pre>