擅长:python、mysql、java
<p>对于大文件,请使用lxml.etree.iterparse()与zipfile模块结合使用,可直接从压缩文件中读取。这将返回一个必须显式打开的迭代器,以防止整个文件被读入内存。在</p>
<pre><code>from lxml import etree
from zipfile import ZipFile
zipped_file = ZipFile(<your file>, 'r')
for event, element in etree.iterparse(zipped_file.open(<filename inside zip>)):
for item in [ogrid_cde, role]:
if item in element.tag:
print('{}: {}'.format(item, element.text))
</code></pre>
<p>它应该打印出成对的字段名(与元素标记匹配的项)和值(从元素检索到的文本)。在</p>