Python如何找到独特的条目并从匹配的数组中获取最小值

import numpy as np indicesOUT = [] distancesOUT = [] for i in range(6): for j in range(6): for k in range(6): if len([s for s in indicesOUT if [i,j,k] == s]) == 0: current = np.array([i, j, k]) ind = np.where((indices == current).all(-1) == True)[0] currentDistances = distances[ind] dist = np.amin(distances) indicesOUT.append([i, j, k]) distancesOUT.append(dist)

1条回答

网友

1楼 · 发布于 2024-10-04 05:20:09

这本质上是一个分组操作，而NumPy并没有为此进行很好的优化。幸运的是，Pandas包有一些非常快速的工具，可以适应这个确切的问题。利用以上数据，我们可以做到：

import pandas as pd

def drop_duplicates(indices, distances):
    data = pd.Series(distances)
    grouped = data.groupby(list(indices.T)).min().reset_index()
    return grouped.values[:, :3], grouped.values[:, 3]

数据的输出是

array([[  0.,   0.,   0.],
       [  2.,   0.,   2.],
       [ 95.,  71.,  95.]]),
array([  0.98713981,   1.42340327,  74.84623217])

我的基准测试显示，对于4000000个元素，这应该在大约一秒钟内运行：

indices = np.random.randint(0, 100, size=(4000000, 3))
distances = np.random.random(4000000)
%timeit drop_duplicates(indices, distances)
# 1 loops, best of 3: 1.15 s per loop

如上所述，索引的输入顺序不一定会被保留；保持原始顺序需要更多的考虑。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章