在Python中使用xml属性和值的xml2csv

2024-10-01 13:40:25 发布

您现在位置:Python中文网/ 问答频道 /正文

如何将结构复杂的大型xml(500M)转换为csv?在

XML示例:

<images>
<image ismain="1" sml="1" med="1" big="0"><id>2</id><title><![CDATA[]]></title><url>www.mysite.com/45656.jpeg</url></image>
<image ismain="1" sml="1" med="0" big="1"><id>2</id><title><![CDATA[]]></title><url>www.mysite.com/354456.jpeg</url></image>
</images>

编写Python代码:

^{pr2}$

实际产量:

id,title,url
2,,www.mysite.com/45656.jpeg
2,,www.mysite.com/354456.jpeg

预期产量:

id,ismain sml med big,title,url
2,,,,,www.mysite.com/45656.jpeg
2,,,,,www.mysite.com/354456.jpeg

Tags: imagecomidurltitlewwwmedjpeg
1条回答
网友
1楼 · 发布于 2024-10-01 13:40:25

就我所使用的xmlutils而言,它不能很好地处理复杂的结构,例如带有嵌套标记的XML。此外,您还需要所有属性。在

我曾在一个公司的项目中做过这方面的工作,基本上我必须编写自己的解析代码。在

您可以使用Python内置的xml库来解析XML,并检查start和{}标记等事件,然后提取数据。在

事实上,如果所有的标记名都在lowercase中,那么可以使用Python的HTMLParser。它有预先定义的函数来处理事件,您可以直接重写这些函数。但是,它将标记名转换为小写(如果它们最初是大写的)。在

相关问题 更多 >