擅长:python、mysql、java
<p>来自文档的<code>lxml</code>的解决方案:</p>
<pre><code>from lxml import etree
from StringIO import StringIO
xml = etree.parse(StringIO('''<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/></TextWithNodes>'''))
xml.xpath("//text()")
Out[43]: ['\n', 'TEXT1', 'TEXT2 ', 'TEXT3']
</code></pre>
<p>还可以提取特定节点的文本:</p>
^{pr2}$
<p>这里的问题是XML中的文本不属于任何节点。在</p>