我想访问子节点中的信息。这是因为文件的结构吗?在
尝试单独提取文件中的作者子节点信息并运行python代码。很好用
import urllib
import xml.etree.ElementTree as ET
url = 'https://dailymed.nlm.nih.gov/dailymed/services/v2/spls/fe9e8b7d-61ea-409d-84aa-3ebd79a046b5.xml'
print 'Retrieving', url
document = urllib.urlopen (url).read()
print 'Retrieved', len(document), 'characters.'
print document[:50]
tree = ET.fromstring(document)
lst = tree.findall('title')
print lst[:100]
我通常更喜欢使用beautifulsoup 和
lxml
解析器来解析xml。 下面的示例代码输出
^{pr2}$然后,您可以使用BeautifulGroup提供的方法,如}来查找相应的节点或子节点
find
和{您可以使用xmltodict从请求的XML数据生成python字典。。在
下面是一个基本示例:
由于命名空间的原因,找不到标题元素。在
下面是要查找的示例代码:
更新
如果需要搜索XML节点,则应使用xPath Expressions
示例:
^{pr2}$此示例打印ID为829076996的作者名
更新2
您可以使用findall方法轻松处理所有assignedEntity标记。 对于每种方法,您可以有多个产品,因此需要另一个findall方法(参见下面的示例)。在
结果是:
相关问题 更多 >
编程相关推荐