Python删除组合字典lis中的重复值

2024-05-11 17:32:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要一点家庭作业的帮助。我必须编写一个函数,将多个词典组合成新词典。如果一个键出现了不止一次;对应于新字典中该键的值应该是唯一的列表。作为一个例子,这就是我目前所拥有的:

f = {'a': 'apple', 'c': 'cat', 'b': 'bat', 'd': 'dog'}
g =  {'c': 'car', 'b': 'bat', 'e': 'elephant'}
h = {'b': 'boy', 'd': 'deer'}
r = {'a': 'adam'}

def merge(*d):
    newdicts={}
    for dict in d:
        for k in dict.items():
            if k[0] in newdicts:
                newdicts[k[0]].append(k[1])
            else:
                newdicts[k[0]]=[k[1]]
    return newdicts

combined = merge(f, g, h, r)
print(combined)

输出如下:

{'a':['apple','adam','c':['cat','car','b':['bat','bat','boy','e':['elephant','d':['dog','deer']}

在“b”键下,“bat”出现两次。如何删除重复项?

我在filter下面查过了,lambda,但是我不知道如何使用(也许b/c是字典里的一个列表?)

任何帮助都将不胜感激。提前感谢你的帮助!


Tags: inapple列表字典mergecarcat词典
3条回答

在for循环中添加以下内容:

for dict in d:
    for k in dict.items():
        if k[0] in newdicts:
            # This line below
            if k[1] not in newdicts[k[0]]:
                newdicts[k[0]].append(k[1])
        else:
            newdicts[k[0]]=[k[1]]

这确保不会添加重复项

在添加之前,只需测试列表中的元素:

for k in dict.items():
    if k[0] in newdicts:
        if k[1] not in newdicts[k[0]]:  # Do this test before adding.
            newdicts[k[0]].append(k[1])
    else:
        newdicts[k[0]]=[k[1]]

因为您只需要value列表中的唯一元素,所以可以使用Set作为值。另外,您可以在这里使用defaultdict,这样您就不必在添加之前测试密钥是否存在。

另外,不要使用内置变量名。而不是其他变量。

因此,可以将merge方法修改为:

from collections import defaultdict

def merge(*d):
    newdicts = defaultdict(set)  # Define a defaultdict
    for each_dict in d:

        # dict.items() returns a list of (k, v) tuple.
        # So, you can directly unpack the tuple in two loop variables.
        for k, v in each_dict.items():  
            newdicts[k].add(v)

    # And if you want the exact representation that you have shown   
    # You can build a normal dict out of your newly built dict.
    unique = {key: list(value) for key, value in newdicts.items()}
    return unique
>>> import collections
>>> import itertools
>>> uniques = collections.defaultdict(set)
>>> for k, v in itertools.chain(f.items(), g.items(), h.items(), r.items()):
...   uniques[k].add(v)
... 
>>> uniques
defaultdict(<type 'set'>, {'a': set(['apple', 'adam']), 'c': set(['car', 'cat']), 'b':        set(['boy', 'bat']), 'e': set(['elephant']), 'd': set(['deer', 'dog'])})

注意,结果是一个集合,而不是一个列表——这样计算效率更高。如果您希望最终表单是列表,则可以执行以下操作:

>>> {x: list(y) for x, y in uniques.items()}

{'a':['apple','adam','c':['car','cat','b':['boy','bat','e':['elephant','d':['deer','dog']}

相关问题 更多 >