以数组作为值的字典

DF = {'z_eu': array([127.45064758, 150.4478288 , 150.74781189, -98.3227338 , -98.25155681, -98.24993753]), 'Process': array(['initStep', 'Transportation', 'Transportation', 'Transportation', 'Transportation', 'phot']), 'Creator': array(['SynRad', 'SynRad', 'SynRad', 'SynRad', 'SynRad', 'SynRad']) }

2条回答

网友

1楼 · 编辑于 2024-09-30 18:24:34

您可以循环一个数组，并通过索引获得正确的元素

z_eu = DF['z_eu']
process = DF['Process']
creator = DF['Creator']

result = []
for i in range(len(z_eu)):
    if process[i] == 'initStep' and creator[i] == 'SynRad':
        result.append(z_eu[i])
print(result)

网友

2楼 · 编辑于 2024-09-30 18:24:34

更简单一点，使用条件切片可以编写

data = DF['z_eu'][(DF['Process'] == 'initStep') & (DF['Creator'] == 'SynRad')]

…或者仍然使用zip，您可以简化为

data = [z for z, p, c in zip(*DF.values()) if p == 'initStep' and c == 'SynRad']

基本上也是条件切片，使用pandasDataFrame：

df = pd.DataFrame(DF)
data = df.loc[(df['Process'] == 'initStep') & (df['Creator'] == 'SynRad'), 'z_eu']
print(data)
# 0    127.450648
# Name: z_eu, dtype: float64

原则上，我认为在dict中处理numpy数组没有什么问题。如果直接在numpy中进行运算，您会有很大的灵活性，有时运算效率会更高（您甚至可以利用numba进行纯数值的、昂贵的计算）-但是如果不需要这样做，并且您基本上可以使用n*m表，pandasdfs非常好而且方便。你知道吗

如果您的数据集很大，并且希望执行如图所示的许多查找，则可能不希望对字符串执行这些查找。为了提高性能，您可以为示例中的每个“进程”或“创建者”提供唯一的ID（整数）。您只需要能够将它们映射回原始字符串，所以也要保留这些数据。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章