统计列表中单词的频率并删除不受欢迎的单词

data = [['Biz_Innovations', '#socialmedia'], ['ChantalGrange', '#aws'], ['beyonddevops', '#aws'], ['beyonddevops', '#socialmedia'], ['IBMNetezza', '#ibm'], ['IBMNetezza', '#analytics'], ['SandraFeinsmith', '#ibm'], ['SandraFeinsmith', '#analytics'], ['fleejack', '#healhcare'], ['bigdataweek', '#socialmedia'], ['sabumjung', '#aws']]

3条回答

网友

1楼 · 编辑于 2024-09-29 01:20:27

您可以使用collections.Counter来实现：

import collections
counts = collections.Counter(tag for (_, tag) in data)
data = [[val, tag] for (val, tag) in data if counts[tag] >= 3]

网友

2楼 · 编辑于 2024-09-29 01:20:27

>>> import collections, operator
>>> words = collections.Counter(map(operator.itemgetter(1), data))
>>> populars = [p for p in data if words[p[1]] >= 3]

网友

3楼 · 编辑于 2024-09-29 01:20:27

In [16]: from collections import Counter

In [17]: keepers = [a[0] for a in Counter(d[1] for d in data).items() if a[1]>=3]

In [18]: [d for d in data if d[1] in keepers]
Out[18]: 
[['Biz_Innovations', '#socialmedia'],
 ['ChantalGrange', '#aws'],
 ['beyonddevops', '#aws'],
 ['beyonddevops', '#socialmedia'],
 ['bigdataweek', '#socialmedia'],
 ['sabumjung', '#aws']]

相关问题更多 >

编程相关推荐

热门问题

热门文章

统计列表中单词的频率并删除不受欢迎的单词

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >