Python在字典列表中查找重复项并对其进行分组问题的回答

Python在字典列表中查找重复项并对其进行分组

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

由于您的数据未排序，请使用<a href="http://docs.python.org/2/library/collections.html#collections.defaultdict" rel="nofollow">^{<cd1>} object</a>来具体化新键的列表，然后按胶片标题键： <pre><code>from collections import defaultdict grouped = defaultdict(list) for film in f: grouped[film['film'][0]].append(film) </code></pre> {cd2>值是用来分组的。如果要使用更复杂的标题分组，则必须创建该密钥的规范版本。在 演示： ^{pr2}$ 使用<a href="http://en.wikipedia.org/wiki/Soundex" rel="nofollow">SoundEx</a>对胶片进行分组非常简单： <pre><code>from itertools import groupby, islice, ifilter _codes = ('bfpv', 'cgjkqsxz', 'dt', 'l', 'mn', 'r') _sounds = {c: str(i) for i, code in enumerate(_codes, 1) for c in code} _sounds.update(dict.fromkeys('aeiouy')) def soundex(word, _sounds=_sounds): grouped = groupby(_sounds[c] for c in word.lower() if c in _sounds) if _sounds.get(word[0].lower()): next(grouped) # remove first group. sdx = ''.join([k for k, g in islice((g for g in grouped if g[0]), 3)]) return word[0].upper() + format(sdx, '<03') grouped_by_soundex = defaultdict(list) for film in f: grouped_by_soundex[soundex(film['film'][0])].append(film) </code></pre> 导致： <pre><code>>>> pprint(dict(grouped_by_soundex)) {u'B436': [{u'director': [u'Ridley Scott'], u'film': [u'Blade Runner'], u'price': [u'19,99'], u'year': [u'1982']}], u'K414': [{u'director': [u'Tarantino'], u'film': [u'Kill Bill vol.1'], u'price': [u'10,00'], u'year': [u'2003']}], u'P412': [{u'director': [u'Tarantino'], u'film': [u'Pulp Fiction'], u'price': [u'20,00'], u'year': [u'1994']}, {u'director': [u'Tarantino'], u'film': [u'Pulp Fyction'], u'price': [u'15,00'], u'year': [u'1994']}], u'S363': [{u'director': [u'E. de Souza'], u'film': [u'Street Fighter'], u'price': [u'2,00'], u'year': [u'1994']}], u'T536': [{u'director': [u'Wachowski'], u'film': [u'The Matrix'], u'price': [u'19,00'], u'year': [u'1999']}, {u'director': [u'Wachowski'], u'film': [u'The Matrix Reloaded'], u'price': [u'9,99'], u'year': [u'2003']}, {u'director': [u'Wachowski'], u'film': [u'The Matrix'], u'price': [u'20,00'], u'year': [u'1999']}]} </code></pre>

Python在字典列表中查找重复项并对其进行分组

1 个回答

相关Python问题