使用io.*类的缓冲迭代器

1条回答

网友

1楼 · 发布于 2024-10-05 13:22:20

这里不需要使用任何类。实际上，您并不是在执行I/O，而是在进行缓冲（这不是I/O所独有的）。尝试重用BufferIOBase接口在这里是次优的，因为您的输入是iterable，输出也是iterable；两者都不是类似于文件的对象，.read()也没有{}可用于填充缓冲区。在

您可以自己实现该类；我使用了^{} type使其尽可能高效：

from collections import deque

class BufferedIterator:
    """Turns an iterable of str lines into chunks of a fixed size"""
    def __init__(self, it, buffer=2**12):
        self._it = iter(it)
        self._buffersize = buffer
        self._lengths, self._lines = deque(), deque()

    def __iter__(self):
        return self

    def __next__(self):
        if self._it is None:
            raise StopIteration

        # collect enough lines to fill the buffer
        bsize = self._buffersize
        while sum(self._lengths) < bsize:
            line = next(self._it, None)
            if line is None:
                # out of data, build the chunk from the remainder
                # clear the iterable to flag that we are done
                self._it = None
                if not self._lines:
                    # edgecase, never had any lines to begin with
                    raise StopIteration
                break
            self._lines.append(line)
            self._lengths.append(len(line))

        # build a chunk from the buffered lines
        chunklength = 0
        chunk = []
        while self._lines and chunklength < bsize:
            length, linechunk = self._lengths.popleft(), self._lines.popleft()
            needed = bsize - chunklength
            if length > needed:
                # only need a substring
                self._lengths.appendleft(length - needed)
                self._lines.appendleft(linechunk[needed:])
                length, linechunk = needed, linechunk[:needed]
            chunklength += length
            chunk.append(linechunk)
        return ''.join(chunk)

    next = __next__  # Python 2

通过使用两个deque对象，一个用于长度，一个用于行本身，我们避免了过于频繁地调用len()。获取一个字符串的长度是足够便宜的，但是每次推送和弹出当前堆栈帧来检索它的成本很高，因此需要避免这种情况。在

演示：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用io.*类的缓冲迭代器

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >