如何计算numpy数组中两行之间的欧氏距离

2024-10-06 14:19:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个numpy数组,如:

import numpy as np
a = np.array([[1,0,1,0],
             [1,1,0,0],
             [1,0,1,0],
             [0,0,1,1]])

我想计算每对行之间的euclidian distance

from scipy.spatial import distance
for i in range(0,a.shape[0]):
    d = [np.sqrt(np.sum((a[i]-a[j])**2)) for j in range(i+1,a.shape[0])]
    print(d)

[1.4142135623730951, 0.0, 1.4142135623730951]

[1.4142135623730951, 2.0]

[1.4142135623730951]

[]

既然我必须在一个巨大的numpy数组上运行这段代码,有没有更好的pythonic方法可以做到这一点?


Tags: infromimportnumpyforasnprange
3条回答

对于更“优雅”的东西,你可以使用scikitlearn对欧几里德距离:

from sklearn.metrics.pairwise import euclidean_distances
euclidean_distances(a,a)

具有与单个数组相同的输出。

array([[ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  0.        ,  1.41421356,  2.        ],
       [ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  2.        ,  1.41421356,  0.        ]])

我将itertools.combinations与差分向量的np.linalg.norm一起使用(这是欧几里德距离):

import numpy as np
import itertools
a = np.array([[1,0,1,0],
              [1,1,0,0],
              [1,0,1,0],
              [0,0,1,1]])

print([np.linalg.norm(x[0]-x[1]) for x in itertools.combinations(a, 2)])

为了理解,请从docs
combinations('ABCD', 2)给出AB AC AD BC BD CD。在你的例子中,ABCD是矩阵的行a,所以上面代码中出现的x[0]-x[1]a行中向量的差分向量。

而对于完整性,einsum经常被用于距离计算。

a = np.array([[1,0,1,0],
         [1,1,0,0],
         [1,0,1,0],
         [0,0,1,1]])

b = a.reshape(a.shape[0], 1, a.shape[1])

np.sqrt(np.einsum('ijk, ijk->ij', a-b, a-b))

array([[ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  0.        ,  1.41421356,  2.        ],
       [ 0.        ,  1.41421356,  0.        ,  1.41421356],
       [ 1.41421356,  2.        ,  1.41421356,  0.        ]])

相关问题 更多 >