我有一个这样的HDF文件:
>>> dataset.store
... <class 'pandas.io.pytables.HDFStore'>
... File path: ../data/data_experiments_01-02-03.h5
... /exp01/user01 frame_table (typ->appendable,nrows->221,ncols->124,indexers->[index])
... /exp01/user02 frame_table (typ->appendable,nrows->163,ncols->124,indexers->[index])
... /exp01/user03 frame_table (typ->appendable,nrows->145,ncols->124,indexers->[index])
... /exp02/user01 frame_table (typ->appendable,nrows->194,ncols->124,indexers->[index])
... /exp02/user02 frame_table (typ->appendable,nrows->145,ncols->124,indexers->[index])
... /exp03/user03 frame_table (typ->appendable,nrows->348,ncols->124,indexers->[index])
... /exp03/user01 frame_table (typ->appendable,nrows->240,ncols->124,indexers->[index])
我想从中检索一个实验(exp0Z)中的所有用户(userXY),并将它们附加到单个大数据帧中。我尝试store.get('exp03')
获取以下错误:
我可以通过调用store.get('exp03/user01')
来检索单个用户,所以我想可以迭代store.keys()
并手动附加检索到的数据帧,但我想知道是否可以在一次调用store.get()
或其他类似方法中这样做。在
EDIT:注意dataset是一个包含熊猫.hdf商店在
虽然这可能是一个很好的特性,但没有实现。(而且,我不会在
.get(...)
中默认设置它,因为它不够明确(例如,它应该总是读取所有表,猜测太多),但是可以有一个参数来控制我假设的子表。如果你有兴趣实现这个,请把github。在不过,您可以使用一些内部函数来简化这一过程(甚至可以向每个select传递一个
where
)。在但是请记住,如果我这样做,那么当数据相同时,它们没有理由有单独的节点;如果在一个表中有一个字段(比如一个字段)来指示它的名称或id或其他任何东西,那么它们的效率要高得多。在
我几乎总是为异构数据使用不同的节点(不需要不同的数据类型,但需要不同的数据类型)。在
也就是说,你可以随心所欲地组织!在
相关问题 更多 >
编程相关推荐