使用Python中的矩阵格式计算我自己的相似度

Countries Commodity1 Commodity2 Commodity45 Commodity85 GER 200 300 45 0 USA 0 100 0 500 UK 0 240 0 900

for i in range(len(matrix_c1_products)): for j in range(i, len(matrix_c1_products)): dividend=sum([matrix_c1_products[i]])+sum([matrix_c1_products[j]]) for k in matrix_c1_products[i]: for l in matrix_c1_products[j]: # print k,l if int(k)==int(0): pass if int(l)==int(0): pass else: commonone.append(k) commontwo.append(l) divisor=sum(commonone)+sum(commontwo) shares=int(divisor/dividend) print shares, divisor, dividend

1条回答

网友

1楼 · 发布于 2024-09-30 16:31:35

作为一种更为python的方法，您可以首先创建一个行的字典，它可以通过以下dict理解来完成：

hart_dict={i[0]:map(int,i[1:]) for i in spamreader}
{' USA': [0, 100, 0, 500], ' GER': [200, 300, 45, 0], ' UK': [0, 240, 0, 900]}

然后使用itertools.combinations创建您的对：

^{pr2}$

然后计算商品的总和：

row_sums=[sum(map(int,i)) for i in z]
[200, 640, 45, 1400]

最后，你可以循环计算出你的预期结果。在

import csv
from itertools import combinations,izip

commodities=['Commodity1' ,'Commodity2', 'Commodity45' ,'Commodity85']
with open('ex.csv', 'rb') as csvfile:
    spamreader = list(csv.reader(csvfile, delimiter=','))
    chart_dict={i[0]:map(int,i[1:]) for i in spamreader}
    z=izip(*spamreader)
    capirs= list(combinations(next(z),2))
    row_sums=[sum(map(int,i)) for i in z]

    for i,j in capirs:
      for index,com in enumerate(commodities):
        print i,j,com,float(chart_dict[i][index]+chart_dict[j][index])/row_sums[index]

结果：

GER  USA Commodity1 1.0
 GER  USA Commodity2 0.625
 GER  USA Commodity45 1.0
 GER  USA Commodity85 0.357142857143
 GER  UK Commodity1 1.0
 GER  UK Commodity2 0.84375
 GER  UK Commodity45 1.0
 GER  UK Commodity85 0.642857142857
 USA  UK Commodity1 0.0
 USA  UK Commodity2 0.53125
 USA  UK Commodity45 0.0
 USA  UK Commodity85 1.0

相关问题更多 >

编程相关推荐

热门问题

热门文章