Python中文
首页
教程
问答
标签
搜索
登录
注册
仅解析XML fi的特定子树
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个巨大的XML文件。不过,我只对这棵巨树的一棵小子树感兴趣。我想解析这个子树,但我不想浪费时间分析整个大型树,因为我只会使用它的一小部分。在</p> <p>理想情况下,我希望扫描整个文件,直到找到子树的开始,解析子树直到到达它的结尾,然后甚至不必费心阅读文件的其余部分。甚至可以用XPath表达式描述我感兴趣的子树。有没有一种方法可以使用<a href="http://lxml.de/" rel="nofollow noreferrer">lxml</a>?看起来您可以使用<code>iterparse()</code>方法来完成类似的操作,但是基于文档,它看起来并没有生成我想要使用的解析对象。有什么建议吗?在</p> <p>(不需要使用lxml,但我希望使用Python,而且理想情况下,我希望它速度更快。)</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>Iterparse仍然需要解析所有内容,直到您想要的子树为止。在使用正则表达式将子树输入解析器之前,提取子树可能更有效。您可能想尝试编写一个sax解析器。Sax可能比lxml慢,但它不会占用太多内存,所以在某些情况下可能会更好。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
2 回答
如何添加表示整数的擦边字符串?
8 回答
如何添加要在Bokeh中使用的新font.ttf文件?
4 回答
如何添加要显示的矩阵XY轴编号和XY轴
2 回答
如何添加计数?
7 回答
如何添加计数器函数?
9 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
10 回答
如何添加计数器来跟踪while循环中的月份和年份?
3 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
9 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
4 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
10 回答
如何添加评论拉梅尔亚姆
7 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
6 回答
如何添加谷歌地点自动完成到Flask?
3 回答
如何添加超时、python discord bot
6 回答
如何添加超过1dp的检查
10 回答
如何添加距离方法
6 回答
如何添加跟随游戏的敌人精灵
1 回答
如何添加路径以便python可以找到程序?
3 回答
如何添加身份验证/安全性以使用happybase访问HBase?
9 回答