Python/Collections删除出现相同次数的元素

2024-06-25 23:06:06 发布

您现在位置:Python中文网/ 问答频道 /正文

例1:

import collections

list = ['Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob', 'Carl', 'Carl']
list_counter = collections.Counter(list)
>> Counter({'Mike': 3, 'Rob': 2, 'Jhon': 2, 'Carl': 2})

例2:

import collections
list = ['Sam', 'Sam', 'Sam', 'Sam', 'Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob']
list_counter = collections.Counter(list)
>> Counter({'Sam': 4, 'Mike': 3, 'Rob': 2, 'Jhon': 2})

我所要做的就是验证列表中是否有2个或更多元素的次数相同,然后删除它们。你知道吗

在示例1中,Rob、Jhon和Carl将被删除,它们是列表中出现2次的3个元素。在示例2中,Rob和Jhon将被删除,而Sam和Mike则可以,并留在列表中。如果列表中只出现1个元素(例如jhonn次),则不会删除任何内容。你知道吗


Tags: import元素示例列表samcounter次数collections
3条回答

我的方法是首先将具有相同count的所有元素分组到defaultdict对象中,然后根据过滤条件构建结果字典:

>>> from collections import Counter, defaultdict  
>>>
>>> lst = ['Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob', 'Carl', 'Carl']
>>> c = Counter(lst)
>>> c
Counter({'Mike': 3, 'Carl': 2, 'Rob': 2, 'Jhon': 2})
>>>
>>> d = defaultdict(list)
>>> 
>>> for k,v in c.items():
        d[v].append(k)
>>> 
>>> d
defaultdict(<class 'list'>, {2: ['Jhon', 'Rob', 'Carl'], 3: ['Mike']})
>>>
>>> result = dict((*v,k) for k,v in d.items() if len(v) < 2)
>>> result
{'Mike': 3}
>>> 

通过使用.values(),然后对出现>=2次的值进行列表理解,可以找到所有不同的量:

values = collections.Counter(list_counter.values())
result = [item for item in list if values[item] >= 2]

但是,我不会使用list作为变量名,因为它会隐藏内置类型。你知道吗

如果要删除至少两次以相同频率出现的所有名称:

import collections

lst = ['Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob', 'Carl', 'Carl',
       "foo","foo","foo","foo","bar", "bar", "bar", "bar"]
list_counter = collections.Counter(lst)

# count the frequency 
times = collections.Counter(list_counter.values())

# keep names that do not appear at the same frequency as any other names
lst[:] = [name for name,v  in list_counter.items() if times[v] < 2]
print(lst)

这会给你留下:

['Mike']

如果还要确保计数不是1:

[name for name, v  in list_counter.items() if v == 1 or times[v] < 2]

如果要保留所有麦克风,请遍历列表:

import collections

lst = ['Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob', 'Carl', 'Carl',
       "foo","foo","foo","foo","bar", "bar", "bar", "bar"]
list_counter = collections.Counter(lst)
times = collections.Counter(list_counter.values())

lst[:] = [name for name in lst if times[list_counter[name]] < 2]
print(lst)

这会给你:

 ['Mike', 'Mike', 'Mike']

相关问题 更多 >