从格式不正确的XML中获取列名

<Placemark> <name>India </name> <description>Country</description> <styleUrl>#icon-962-B29189</styleUrl> </Placemark> <Placemark> <name>USA</name> <styleUrl>#icon-962-B29189</styleUrl> </Placemark> <Placemark> <description>City</description> <styleUrl>#icon-962-B29189</styleUrl> </Placemark>

1条回答

网友

1楼 · 发布于 2024-10-03 11:14:30

因为您分别搜索name和description标记，所以您无法知道哪个名称属于哪个描述。你知道吗

相反，您应该单独解析每个placemark标记，并处理每个placemark标记缺少name和description标记的情况。你知道吗

data = []

for placemark in soup.findAll('placemark'):
    try:
        name = placemark.find('name').text.strip()
    except AttributeError:
        name = None
    try:
        description = placemark.find('description').text.strip()
    except AttributeError:
        description = None

    data.append((name, description))

df = pd.DataFrame(data, columns=['Name', 'Description'])
print(df)
#       Name    Description
#  0   India        Country
#  1     USA           None
#  2    None           City

相关问题更多 >

编程相关推荐

热门问题

热门文章

从格式不正确的XML中获取列名

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >