Python:解析不完整的XML块

2条回答

网友

1楼 · 编辑于 2024-10-03 23:18:00

您正在尝试在获得适当的XML陷阱之前创建一个XML对象（我相信您已经知道了）。基本上，您已经将所有的字符串/块连接在一起，一旦您有了完整的XML，就可以使用完整的字符串创建一个XML对象。使用拜特西奥或者斯金吉奥每当你从服务器上得到一些东西，就把它写到缓冲区，然后解析缓冲区，取出你需要的东西。在

扭曲的例子：

from io import StringIO

def __init__(self):
    self.buffer = StringIO()    # Buffer obj

def dataReceived(self, data):
    # this is data that is received from the server
    self.buffer.write( data )    # Usually want this in a callBack

def processBuffer(self):
    string = self.buffer.getvalue()
    ''' Do your parsing 
        Then once you have the complete xml
        do etree.fromstring( string ) or equivalant'''

希望这有帮助，我们在工作中做了一些非常相似的事情，但我不记得我们是如何实现的。在

网友

2楼 · 编辑于 2024-10-03 23:18:00

您也许可以使用ET.iterparse来增量解析XML块：

import xml.etree.ElementTree as ET

chunks = iter([
    '<root>'
    '<el a="1" b=',
    '"2"><sub c="',
    '3">test</sub',
    '></el><el d=',
    '"4" e="5"></',
    'el>',
    '</root>'
    ])


class Source(object):
    def read(self, size):
        # Replace this with code that reads XML chunks from the server
        return next(chunks)

for event, elem in ET.iterparse(Source(), events=('end', )):
    if elem.tag == 'el':
        print(elem)
        # handle_element(elem)

收益率

^{pr2}$

ET.iterparse的第一个参数通常是文件名或拜特西奥或StringIO对象。但是，它可以是任何具有read方法的对象。因此，如果您创建了一个对象，其read方法从服务器读取，那么您可以将其挂接到ET.iterparse中执行增量解析。在

注意，ET.iterparse将使用请求的字节数调用read方法（例如read(16384)）。如果服务器只提供给你更少的字节，那么你可以返回更少的字节，但是我不确定如果你返回的字节数超过了请求的字节数，是否会发生什么不好的事情。理想情况下，您应该能够将请求的字节数传递给服务器，并依赖服务器提供正确的字节数（或更少）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章