如何使用Python提取/解析字典元素？

<CATALOG> <CD decade="00s"> <TITLE>Gorillaz</TITLE> <ARTIST>Gorillaz</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin</COMPANY> <PRICE>10.90</PRICE> <YEAR>2001</YEAR> </CD> <CD decade="00s"> <TITLE>Demon Days</TITLE> <ARTIST>Gorillaz</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Parlaphone</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD>

import xml.etree.ElementTree as ET tree = ET.parse("gorillaz_catalog.xml") root = tree.getroot() for ARTIST in root.iter("ARTIST"): print("Artist:", ARTIST.text) for TITLE in root.iter("TITLE"): print("Title:", TITLE.text) for decade in root.iter("CD"): print("Decade:", decade.attrib)

for ARTIST in root.iter("ARTIST"): for TITLE in root.iter("TITLE"): for decade in root.iter("CD"): print("Artist:", ARTIST.text,", Title:", TITLE.text, ", Decade:", decade.attrib)

2条回答

网友

1楼 · 编辑于 2024-09-21 00:52:09

这是我在发布后查看更多文档后的最终代码。谢谢大家的建议

import xml.etree.ElementTree as ET

tree = ET.parse("gorillaz_catalog.xml")
root = tree.getroot()

for item in tree.iterfind("CD"):
    artist = item.findtext("ARTIST")
    title = item.findtext("TITLE")
    decade = item.get("decade")
    print(f"Artist: {artist}, Album: {title}, Decade: {decade}")

输出：

> Title: Gorillaz, Album: Gorillaz, Decade: 00s
> Title: Gorillaz, Album: Demon Days, Decade: 00s

网友

2楼 · 编辑于 2024-09-21 00:52:09

我觉得你把事情弄得有点太复杂了；使用另一个库和xpath进行尝试：

import lxml.html as lh

cds = """[your html above]"""

doc = lh.fromstring(cds)
for cd in doc.xpath('//cd'):
    decade = cd.xpath('./@decade')[0]
    title = cd.xpath('./title/text()')[0]
    artist = cd.xpath('./artist/text()')[0]
    print("Title: "+title+", Artist: "+artist+", Decade: "+decade)

输出：

Title: Gorillaz, Artist: Gorillaz, Decade: 00s
Title: Demon Days, Artist: Gorillaz, Decade: 00s

相关问题更多 >

编程相关推荐

热门问题

热门文章