擅长:python、mysql、java
<p>您需要知道<a href="http://lxml.de/api/lxml.etree._Element-class.html#tail" rel="nofollow noreferrer">^{<cd1>}</a>属性,它是元素结束标记后面的文本。这里有很好的解释:<a href="http://infohost.nmt.edu/tcc/help/pubs/pylxml/web/etree-view.html" rel="nofollow noreferrer">http://infohost.nmt.edu/tcc/help/pubs/pylxml/web/etree-view.html</a>。你知道吗</p>
<p>“Denver”是第一个<code><ut></code>元素的<code>tail</code>,“Score”是第二个<code><ut></code>元素的<code>tail</code>。这些字符串不是<code><seg></code>元素的<code>text</code>的一部分。你知道吗</p>
<p>除了kgbplus提供的解决方案(它同时适用于ElementTree和lxml),对于lxml,您还可以使用以下方法获得所需的输出:</p>
<ol>
<li><p><a href="http://lxml.de/api/lxml.etree._Element-class.html#xpath" rel="nofollow noreferrer">^{<cd8>}</a></p>
<pre><code>for n in seg:
print("".join(n.xpath("text()")))
</code></pre></li>
<li><p><a href="http://lxml.de/api/lxml.etree._Element-class.html#itertext" rel="nofollow noreferrer">^{<cd9>}</a></p>
<pre><code>for n in seg:
print("".join(n.itertext()))
</code></pre></li>
</ol>