我使用python来解析如下所示的xml文件:
<infoTable>
<nameOfIssuer>3 D SYSTEMS CORPORATION NEW</nameOfIssuer>
<titleOfClass>COM</titleOfClass>
<cusip>88554D205</cusip>
<value>1044</value>
<shrsOrPrnAmt>
<sshPrnamt>88292</sshPrnamt>
<sshPrnamtType>SH</sshPrnamtType>
</shrsOrPrnAmt>
<investmentDiscretion>SOLE</investmentDiscretion>
<otherManager>100</otherManager>
<votingAuthority>
<Sole>0</Sole>
<Shared>0</Shared>
<None>150</None>
</votingAuthority>
</infoTable>
我正在分析数千个xml文件,这些文件中有一些<infoTable>
块。如果我的文件中有更多的<infoTable>
块,那么它将停止读取<value>
标记及其内容。在
有人遇到过这样的错误吗?在
作为参考,我在python中使用lxml解析器的代码如下:
^{pr2}$以前有人遇到过这样的错误吗?我不确定内存是否是问题所在,因为我在多台计算机上尝试了相同的代码和相同的xml文件,结果却出现了相同的错误。另外,当我取出有问题的xml块并在该块上运行相同的代码时,它可以正常工作。不知道在这一点上还有什么要看的。在
任何帮助都将不胜感激!在
lxml工作得很好,即使对于a file containing 4,000 ^{} elements 。我将使用XPath来获取
value
元素的文本:输出包含4000行
1044
。在相关问题 更多 >
编程相关推荐