Python中加权成对距离矩阵的计算

2条回答

网友

1楼 · 编辑于 2024-05-17 04:33:39

scipy.spatial.distance是您要查看的模块。它有很多不同的规范，可以很容易地应用。

我建议你用加权蒙科夫斯基矩阵

Weighted Minkowski Metrik

您可以使用这个包中的pdist方法进行成对距离计算。

例如

import numpy as np
from scipy.spatial.distance import pdist, wminkowski, squareform

object_1 = [0.2, 4.5, 198, 0.003]
object_2 = [0.3, 2.0, 999, 0.001]
object_3 = [0.1, 9.2, 321, 0.023]
list_of_objects = [object_1, object_2, object_3]

# make a 4x3 matrix from list of objects
X = np.array(list_of_objects)

#calculate pairwise distances, using weighted Minkowski norm
distances = pdist(X,wminkowski,2, [1,1,1,10])

#make a square matrix from result
distances_as_2d_matrix = squareform(distances)

print distances
print distances_as_2d_matrix

这将打印

[ 801.00390786  123.0899671   678.0382942 ]
[[   0.          801.00390786  123.0899671 ]
 [ 801.00390786    0.          678.0382942 ]
 [ 123.0899671   678.0382942     0.        ]]

网友

2楼 · 编辑于 2024-05-17 04:33:39

标准化步骤是将成对距离除以最大值，这似乎不是标准步骤，可能会使您很难找到一个现成的函数来执行您所要执行的操作。虽然你自己做很容易。一个起点是将list_of_objects转换为数组：

>>> obj_arr = np.array(list_of_objects)
>>> obj_arr.shape
(3L, 4L)

然后可以使用广播获得成对距离。这有点低效，因为它没有利用度量的symetry，并且每两次计算一个距离：

>>> dists = np.abs(obj_arr - obj_arr[:, None])
>>> dists.shape
(3L, 3L, 4L)

标准化非常容易：

>>> dists /= dists.max(axis=(0, 1))

你的最终称重可以通过多种方式进行，你可能需要最快的基准：

>>> dists.dot([1, 1, 1, 1])
array([[ 0.        ,  1.93813131,  2.21542674],
       [ 1.93813131,  0.        ,  3.84644195],
       [ 2.21542674,  3.84644195,  0.        ]])
>>> np.einsum('ijk,k->ij', dists, [1, 1, 1, 1])
array([[ 0.        ,  1.93813131,  2.21542674],
       [ 1.93813131,  0.        ,  3.84644195],
       [ 2.21542674,  3.84644195,  0.        ]])

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中加权成对距离矩阵的计算

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >