可变长度整数编码

1条回答

网友

1楼 · 发布于 2024-09-29 19:01:15

是的，pickle做了类似的事情。在我看来，这很体面。例如，一百万个随机大小为1到16字节的随机整数被编码到~10.75 MB。然后lzma.compress将其降低到~10MB。与8.5MB的“原始数据大小”（100万个整数平均每个8.5字节）相比，情况还不错。LEB128还占用约10 MB的空间，非常小

import os, random, pickle, lzma, leb128

n = 10 ** 6
a = [int.from_bytes(os.urandom(random.randint(1, 16)), 'big') for _ in range(n)]
p = pickle.dumps(a)
print("pickle'd:", f'{len(p):,}', type(p))
z = lzma.compress(p)
print("+ lzma'd:", f'{len(z):,}', type(z))
leb = b''.join(map(leb128.u.encode, a))
print("leb128'd:", f'{len(leb):,}', type(leb))

输出：

pickle'd: 10,751,961 <class 'bytes'>
+ lzma'd: 10,060,252 <class 'bytes'>
leb128'd: 10,016,053 <class 'bytes'>

Try it online!

编程相关推荐

java与springhibernate使用2种不同的数据库连接
java如何将txt文件读取到未知大小的ArrayList
java如何在没有XML的情况下，基于Spring的属性在运行时注入不同的服务
Windows 10中的java检测虚拟桌面
java与串口通信不稳定
java导出为CSV文件并在浏览器中打开
java在MediaStore中分离来自SD卡和设备内部内存的图像
java如何让spring jpa自动创建关系/表？
java将文件读取权限设置为安卓中的文件
java构建大型文件的动态查询

相关问题更多 >

编程相关推荐

热门问题

热门文章

可变长度整数编码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >