在Python中解析大型XML文件时遇到内存错误

2条回答

网友

1楼 · 编辑于 2024-10-02 08:17:34

尝试以下代码：

在lxml.etree在

import lxml.etree
from gzip import open as gopen

class GroupDictTarget(object):
    def __init__(self, d):
        self.d = d
    def start(self, tag, attrib):
        if tag == 'group':
            self.group = self.d[attrib['from'], attrib['to']] = []
        elif tag == 'link':
            self.group.append(attrib['target'])
    def close(self):
        pass

def extractTargets(fin):
    with gopen(fin) as xml:
        targets = {}
        parser = lxml.etree.XMLParser(target=GroupDictTarget(targets))
        lxml.etree.parse(xml, parser)
        return targets

在xml.parsers.expat在

^{pr2}$

在xml.sax文件在

import xml.sax
from gzip import open as gopen

class GroupDictTarget(object):
    # Same as above

def extractTargets(fin):
    targets = {}
    handler = xml.sax.handler.ContentHandler()
    handler.startElement = GroupDictTarget(targets).start
    with gopen(fin) as f:
        xml.sax.parse(f, handler)
    return targets

网友

2楼 · 编辑于 2024-10-02 08:17:34

我今天也遇到了同样的问题，在我删除了“tag”参数之后，它就起作用了：

context = etree.iterparse(xml)

for event, elem in context:
        if elem.tag = "group":
            targets[(elem.get("from"), elem.get("to"))] = elem.xpath("link/@target")
        elem.clear()

        while elem.getprevious() is not None:
            del elem.getparent()[0]
    del context

在lxml.etree在

在xml.parsers.expat在

在xml.sax文件在

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中解析大型XML文件时遇到内存错误

在lxml.etree在

在xml.parsers.expat在

在xml.sax文件在

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >