Pandas read_hdf给出了“只能在表上使用迭代器或chunksize”错误

chunksize = 10**6 someval = 100 df = pd.DataFrame() for chunk in pd.read_hdf(filename, 'rawreport', chunksize=chunksize, where='datetime < someval'): df = pd.concat([df, chunk], ignore_index=True)

1条回答

网友

1楼 · 发布于 2024-09-28 01:32:57

只有使用PyTables以表格格式写入文件时，才能进行分块。必须在首次写入文件时指定此选项：

df.to_hdf('rawreport', format = 'table')

如果在编写文件时没有指定，那么Pandas默认使用fixed格式。这意味着，虽然文件可以在以后快速写入和读取，但这确实意味着必须将整个数据帧读入内存。不幸的是，这意味着这里不能使用read_hdf中的分块和其他选项来指定特定的行或列

编程相关推荐

java Android：位置服务权限
java Android Studio SQLite数据库创建不起作用？
java在Spring boot中添加会话bean导致没有为作用域“Session”注册作用域
正则表达式Java:从组中删除多次出现的不可打印字符
计算行和时出现java错误
java如何将存储在移动设备中的录制视频的Uri传递给另一个活动
java如何从加密字符串中获取原始字符串值？
java无法初始化jNativeHook 2.0
java一个应用程序中的两个并行通知（安卓）
java如何从Android上的Locale对象获取脚本？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas read_hdf给出了“只能在表上使用迭代器或chunksize”错误

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >