Python：“非类型”对象没有属性“文本”，XML解析

<?xml version="1.0" encoding="utf-8"?> <spirit:component xmlns="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:spirit="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5" xsi:schemaLocation="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5 http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5/memoryMap.xsd"> > <spirit:generic> <spirit:name>GENERIC_NAME</spirit:name> <spirit:description>GENERIC_DESCRIPTION</spirit:description> </spirit:generic> </spirit:component>

# Importing the required libraries import xml.etree.ElementTree as Xet import pandas as pd cols = ["name", "description"] rows = [] # Parsing the XML file xmlparse = Xet.parse('xml_sample.xml') root = xmlparse.getroot() for i in root: name = i.find("spirit:name").text description = i.find("spirit:description").text rows.append({"spirit:name": name, "spirit:description": description}) df = pd.DataFrame(rows, columns=cols) # Writing dataframe to csv df.to_csv('output.csv')

1条回答

网友

1楼 · 发布于 2024-10-01 15:40:48

下面的方法似乎有效。注意代码使用的名称空间：{http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5}

import xml.etree.ElementTree as ET
import pandas as pd

xml = '''<?xml version="1.0" encoding="utf-8"?>
<spirit:component xmlns="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xmlns:spirit="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5"
  xsi:schemaLocation="http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5 http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5/memoryMap.xsd">
>
<spirit:generic>
<spirit:name>GENERIC_NAME</spirit:name>
<spirit:description>GENERIC_DESCRIPTION</spirit:description>
</spirit:generic>
</spirit:component>'''

cols = ["name", "description"]
rows = []
root = ET.fromstring(xml)
names = [x.text for x in root.findall('.//{http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5}name')]
descriptions = [x.text for x in root.findall('.//{http://www.spiritconsortium.org/XMLSchema/SPIRIT/1.5}description')]
for entry in zip(names, descriptions):
    rows.append({'name': entry[0], 'description': entry[1]})

df = pd.DataFrame(rows, columns=cols)
print(df)

输出

           name          description
0  GENERIC_NAME  GENERIC_DESCRIPTION

相关问题更多 >

编程相关推荐

热门问题

热门文章