Python中文
首页
教程
问答
标签
搜索
登录
注册
Python 2.7中800gb XML文件的高效读取
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在python 2.7中读取一个800gb的xml文件,并使用etree迭代解析器对其进行解析。</p> <p>目前,我只是使用<code>open('foo.txt')</code>而没有缓冲参数。我有点困惑,这是我应该采用的方法,还是应该使用缓冲参数,或者使用io.BufferedReader或io.open或io.TextIOBase中的某些内容。</p> <p>一个正确的方向将非常感谢。</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我还没有尝试过使用这种史诗般的xml文件,但上一次我不得不处理大型(相对简单的)xml文件时,我使用了<a href="http://docs.python.org/2/library/xml.sax.html" rel="nofollow">sax parser</a>。</p> <p>它基本上为每个“事件”提供回调,并将其留给您存储所需的数据。你可以给一个打开的文件,这样你就不必一下子把它读进去了。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
使用Python创建一个非常大的二进制频率矩阵来运行协作过滤
6 回答
使用Python创建一张HTML网页,其中在不同颜色中重复n遍显示“Hello World”的方法
6 回答
使用Python创建一组唯一的值length L
5 回答
使用python创建不同表格的透视表
2 回答
使用python创建不和谐频道
3 回答
使用python创建不存在的多个文件夹
7 回答
使用python创建串行远程文件
6 回答
使用python创建交互式仪表板时出现问题
3 回答
使用python创建交互式绘图
4 回答
使用python创建交互式自动电子邮件
2 回答
使用Python创建价格列表
3 回答
使用python创建修改的txt文件
1 回答
使用Python创建全局变量,初始化后更改值
4 回答
使用Python创建关键字搜索词数组
1 回答
使用Python创建具有不均匀块大小/堆叠条形图的热图
10 回答
使用Python创建具有依赖于另一列的值的列
5 回答
使用Python创建具有多列的HTML表
9 回答
使用Python创建具有时间范围数据的等距数据帧
2 回答
使用Python创建具有特定顺序或属性的XML文件
9 回答
使用Python创建具有级联功能的搜索栏
5 回答