在术语列表中对项目进行排序

bigram_list = Difensori dei diritti umani, libertà di espressione > Human rights defenders, freedom of expression sgomberi forzati, violazioni dei diritti umani > forced evictions, human rights violations

('Difensori dei diritti umani','Human rights defenders') ('Difensori dei diritti umani','freedom of expression') ('libertà di espressione','Human rights defenders') ('libertà di espressione','freedom of expression')

for line in bigram_list.splitlines(): n = 0 s = 0.001 a = 0 b = 0 c = 0 d = 0 mi = '' bi= [] trans = line.split(' > ') left = trans[0].split(', ') right = trans[1].split(', ') for i in left: for j in right: for line in parallel_corpus.splitlines(): n += 1 if i in line and j in line: a += 1 elif i in line and not j in line: b+= 1 elif j in line and not i in line: c+= 1 else: d +=1 mi = log(((a +s)/n)/(((b+s)/n)*((c+s)/n))) bi.append((i,j,mi)) print (bi)

[('Difensori dei diritti umani', 'Human rights defenders', 9.747427586368971), ('Difensori dei diritti umani', 'freedom of expression', 4.054309816276213), ('libertà di espressione', 'Human rights defenders', 1.7964873912918353), ('libertà di espressione', 'freedom of expression', 3.5916971873132355)] [('sgomberi forzati', 'forced evictions', 9.971061859787796), ('sgomberi forzati', 'human rights violations', 5.278014664230184), ('violazioni dei diritti umani', 'forced evictions', 4.3759922075718447), ('violazioni dei diritti umani', 'human rights violations', 2.760410122135915)]

[('Difensori dei diritti umani', 'Human rights defenders', 4.747427586368971), ('Difensori dei diritti umani', 'freedom of expression', 4.054309816276213), ('libertà di espressione', 'Human rights defenders', 3.7964873912918353), ('libertà di espressione', 'freedom of expression', 3.5916971873132355)]

1条回答

网友

1楼 · 发布于 2024-09-30 05:30:19

因为您只需要具有相同第一个元素和最大值的pair，所以可以创建一个以first element作为键的字典。您可以遍历元组列表并检查key（元组的第一个元素）是否存在。如果确实如此，则检查该值是否高于字典中的值，如果为真，则替换。你知道吗

下面是与您的示例相关的代码：

temp_dict = {}
for i in a:
    if temp_dict.has_key(i[0]):
        if (temp_dict[i[0]][2] < i[2]):
            temp_dict[i[0]] = i
    else:
        temp_dict[i[0]] = i

迭代示例代码中的两个列表后的输出：

{'violazioni dei diritti umani': ('violazioni dei diritti umani', 'forced evictions', 4.375992207571844), 'Difensori dei diritti umani': ('Difensori dei diritti umani', 'Human rights defenders', 9.747427586368971), 'sgomberi forzati': ('sgomberi forzati', 'forced evictions', 9.971061859787795), 'libert\xc3\xa0 di espressione': ('libert\xc3\xa0 di espressione', 'freedom of expression', 3.5916971873132355)}

Demo of your working code

相关问题更多 >

编程相关推荐

热门问题

热门文章