读取多个hdf5文件并将它们附加到新字典中

2024-09-29 21:40:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个hdf5文件的列表,我想打开这些文件并将其读入新字典,最后写入文本文件。我不一定知道这些值,所以用户在一个数组中将它们定义为代码的输入。所需文件的数量由用户希望查看的数据的天数定义。在

new_data_dic = {}

for j in range(len(values)):
    new_data_dic[values[j]] = rbsp_ephm[values[j]]
for i in (np.arange(len(filenames_a)-1)+1):
        rbsp_ephm = h5py.File(filenames_a[i])
        for j in range(len(values)):
            new_data_dic[values[j]].append(rbsp_ephm[values[j]])

如果我只有一个文件,这很好,但如果我有两个或更多的文件,它似乎关闭了密钥?我不确定这是否真的是这样,但是当我问new_data_dic是什么时,它给出的值是{},它不会写入文本文件。我试图在打开下一个文件之前关闭hdf5文件(rbsp_ephm.close()),但我得到了相同的错误。在

谢谢你的帮助!在


Tags: 文件用户innewfordatalen定义
2条回答

我真的不明白你的问题。。。您正在尝试创建hdf5数据集列表? 或者您忘记了访问数据集本身的值的[()]?在

下面是一个简单的独立示例,效果很好:

import h5py

# File creation 
filenames_a = []
values = ['values/toto', 'values/tata', 'values/tutu']

nb_file = 5
tmp = 0
for i in range(nb_file):
    fname = 'file%s.h5' % i
    filenames_a.append(fname)
    file = h5py.File(fname, 'w')
    grp = file.create_group('values')
    for value in values:
        file[value] = tmp
        tmp += 1
    file.close()

# the thing you want
new_data_dict = {value: [] for value in values}

for fname in filenames_a:
    rbsp_ephm = h5py.File(fname, 'r')
    for value in values:
        new_data_dict[value].append(rbsp_ephm[value][()])

print new_data_dict

它返回:

^{pr2}$

它能回答你的问题吗?在

也许不是直接好的解决方案,但是您可以尝试将数据提取为numpy数组,这是一种更灵活的格式,而不是h5py数据集格式。请参见下面的操作方法:

>>> print type(file['Average/u'])
<class 'h5py.highlevel.Dataset'>
>>> print type(file['Average/u'][:])
<type 'numpy.ndarray'>

为了以防万一,您应该尝试使用一种更“pythonic”的循环方式,即:

^{pr2}$

而不是:

for j in range(len(values)):
    new_data_dic[values[j]] = rbsp_ephm[values[j]]

相关问题 更多 >

    热门问题