Python中文
首页
教程
问答
标签
搜索
登录
注册
从python中的大量xml文件中提取信息的最有效方法是什么?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个完整的目录(~10<sup>3</sup>,10<sup>4</sup>),我需要从中提取几个字段的内容。 我已经测试了不同的xml解析器,由于不需要验证内容(代价昂贵),所以我想简单地使用xml.parsers.expat(最快的一个)遍历文件,逐个提取数据。在</p> <ol> <li>有没有更有效的方法?(简单的文本匹配不起作用)</li> <li>我需要为每个新文件(或字符串)发出一个新的ParserCreate(),还是可以对每个文件重复使用同一个?在</li> <li>有什么注意事项吗?在</li> </ol> <p>谢谢!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果您知道XML文件是使用相同的算法生成的,那么完全不进行任何XML解析可能会更有效。E、 如果知道数据在第3、4和5行中,可以逐行读取文件,然后使用正则表达式。在</p> <p>当然,如果文件不是机器生成的,或者来自不同的生成器,或者生成器随着时间的推移而改变,那么这种方法将失败。然而,我乐观地认为它会更有效。在</p> <p>是否回收解析器对象在很大程度上无关紧要。将创建更多的对象,因此单个解析器对象实际上并不重要。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
7 回答
文本小部件:在没有输入时更新并在循环后保持空闲
1 回答
文本小部件tkin
9 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
1 回答
文本小部件tkinter复制图像选项
1 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
10 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
4 回答
文本小部件不显示lis中的内容
4 回答
文本小部件不显示Unicode字符
10 回答
文本小部件中写入的行间距
8 回答
文本小部件中的文本作为变量
4 回答
文本小部件中的滚动条仅显示在底部
6 回答
文本小部件中的选项卡键空间计数
9 回答
文本小部件作为Lis
7 回答
文本小部件在主框架中扩展列宽
1 回答
文本小部件未使用删除功能清除
9 回答
文本小部件滚动动画(Tkinter、Python)
6 回答
文本居中。格式正确吗?
5 回答
文本差分算法
1 回答
文本已知时音频文件中的单词索引
2 回答