擅长:python、mysql、java
<p>您可以使用内置的minidom模块轻松解析:</p>
<pre><code>from xml.dom import minidom
xml = '<xml>História do RFID A tecnologia de <EM ID="hub-30518" CATEG="PESSOA">RFID </EM>tem suas raízes nos sistemas de radares</xml>'
dom = minidom.parseString(xml)
em = dom.getElementsByTagName('EM')[0]
categ = em.getAttribute('CATEG')
text = " ".join(t.nodeValue for t in em.childNodes if t.nodeType == t.TEXT_NODE)
</code></pre>
<p>或者使用内置ElementTree模块的不太详细的方法:</p>
^{pr2}$