pylzma流(de)压缩缓冲区大小

2024-06-02 10:41:56 发布

您现在位置:Python中文网/ 问答频道 /正文

下面是流(de)压缩的一个示例github.com/fancycode/pylzma/blob/master/doc/usage然而,它总是以1字节的速度读取,这显然会变得相对缓慢。在

然而,在大文件上,以较大的大小(例如65k)读取并按原样执行obj.decompress()就成了问题,因为很明显,pylzma将大部分数据存储在内部,然后将其全部解压缩到obj.flush()。在

decompress方法有一个bufsize参数(默认情况下似乎是128k)。将其设置为大于30*read_size(30是近似的压缩比)可以使解压缩按预期工作(并且相当快);但是,这显然会中断,例如,几GB的零字节(因为压缩比会更高)。在

因此,问题是:如何使用pylzma正确(de)压缩文件(使用适当的缓冲区大小来提高速度)?在


Tags: githubmastercomobj示例doc字节usage