如何删除基于d的重复元素

find_dup = {"one":[["1654","raj","425","16-02-2017"],["1654","mo","426","20-02-2017"],["1654","ss","425","20-02-2017"],["1654","vs","427","20-02-2017"],["1654","ss","425","14-02-2017"]]} for d in find_dup: len_d = len(find_dup[d]) store_array_dup = [] store_array_ele = {} for i in find_dup[d]: val = i[0]+"-"+i[1]"-"+i[2]"-"+i[3] val_1 = i[0]+"-"+i[2] if val_1 in store_array_dup: store_array_ele.append(val_1) else: arrs = [] arrs.append(val) store_array_ele[d] = arrs

3条回答

网友

1楼 · 编辑于 2024-09-26 04:48:51

这是您的数据集：

find_dup = {"one":[
                      ["1654","raj","425","16-02-2017"],
                      ["1654","mo","426","20-02-2017"],
                      ["1654","ss","425","20-02-2017"],
                      ["1654","vs","427","20-02-2017"],
                      ["1654","ss","425","14-02-2017"]
                   ]
            }

您可以使用基于第一个和第三个元素的新键在数据集中创建新dict，并按日期排序：

^{pr2}$

输出：

>>> print(new_dict.values())
[['1654', 'vs', '427', '20-02-2017'], ['1654', 'mo', '426', '20-02-2017'], ['1654', 'ss', '425', '20-02-2017']]

网友

2楼 · 编辑于 2024-09-26 04:48:51

首先解决列表列表的问题：

def mounarajan_no_dup(l):
    dedup = {}
    for i in l:
        k = (i[0], i[3])
        if k not in dedup:
            dedup[k] = i
        else :
            j3 = dedup[k][3]
            jdate = j3[6:10] + j3[3:5] + j3[0:2]
            i3 = i[3]
            idate = i3[6:10] + i3[3:5] + i3[0:2]
            if jdate < idate:
                dedup[k] = i
    return dedup.values()

然后将其应用于find_dup的每个条目。在

^{pr2}$

网友

3楼 · 编辑于 2024-09-26 04:48:51

我建议按元组（第一个元素、第三个元素和日期）对列表进行排序，并首先保留最小的日期，然后按第一个和第三个元素对排序后的列表进行分组，最后从每个子组中选择第一个元素：

from itertools import groupby
from operator import itemgetter
from datetime import datetime

find_dup = {"one":[["1654","raj","425","16-02-2017"],["1654","mo","426","20-02-2017"],["1654","ss","425","20-02-2017"],["1654","vs","427","20-02-2017"],["1654","ss","425","14-02-2017"]]}

find_dup_sorted = sorted(find_dup["one"], key=lambda x: (x[0], x[2], datetime.strptime(x[3], "%d-%m-%Y")))

result = {"one": []}

for k, g in groupby(find_dup_sorted, key=itemgetter(0, 2)):
    result["one"].append(next(g))

print result

相关问题更多 >

编程相关推荐

热门问题

热门文章