Python筛选器字典（按特定筛选器元组）

my_dict = { 'LC08_L1TP_200029_20210716_20210721_02_T1': { # best tier for this dataset --> keep it 'cc': 30.57, 'tier': 'T1', }, 'LC08_L1TP_200029_20210716_20210721_02_RT': { # worst tier for this dataset --> remove it 'cc': 30.57, 'tier': 'RT', }, 'LC08_L1TP_200029_20210630_20210708_02_T2': { # worst tier for this dataset --> remove it 'cc': 60.52, 'tier': 'T2', }, 'LC08_L1TP_200029_20210630_20210708_02_RT': { # best tier for this dataset --> keep it 'cc': 60.52, 'tier': 'RT', }, 'LC08_L1TP_200029_20210614_20210628_02_T2': { # only tier for this datset --> keep it 'cc': 15.61, 'tier': 'T2', }, } tiers = ('T1', 'RT', 'T2') # this is the tier order

{ 'LC08_L1TP_200029_20210716_20210721_02_T1': { 'cc': 30.57, 'tier': 'T1', }, 'LC08_L1TP_200029_20210630_20210708_02_RT': { 'cc': 60.52, 'tier': 'RT', }, 'LC08_L1TP_200029_20210614_20210628_02_T2': { 'cc': 15.61, 'tier': 'T2', }, }

3条回答

网友

1楼 · 编辑于 2024-05-19 06:23:26

据我所知，“最佳”是指具有最大cc值的层

您需要首先根据cc键对字典进行排序（）以简化筛选
迭代tiers元组和排序字典，并将匹配的tiers项存储到字典-new_dict
我使用了visited{}来避免再次访问tiers

编辑

You don't need to use a set. Just a break would do. Based on @Xitiz comment.

代码如下：

my_dict = {
    'LC08_L1TP_200029_20210716_20210721_02_T1': {
        'cc': 30.57,
        'tier': 'T1',
    },
    'LC08_L1TP_200029_20210716_20210721_02_RT': {
        'cc': 30.57,
        'tier': 'RT',
    },
    'LC08_L1TP_200029_20210630_20210708_02_T2': {
        'cc': 60.52,
        'tier': 'T2',
    },
    'LC08_L1TP_200029_20210630_20210708_02_RT': {
        'cc': 60.52,
        'tier': 'RT',
    }
}
tiers = ('T1', 'RT', 'T2')  # this is the tier order

# Sorting the dict based on 'cc' in descending order
my_dict = dict(sorted(my_dict.items(), key=lambda x: -x[1]['cc']))
new_dict = {}

for i in tiers:
    for k,v in my_dict.items():
        if v['tier'] == i:
            new_dict.update({k: v})
            break
            
print(new_dict)

输出：

{
{
 'LC08_L1TP_200029_20210716_20210721_02_T1': {
    'cc': 30.57, 
    'tier': 'T1'
}, 
 'LC08_L1TP_200029_20210630_20210708_02_RT': {
    'cc': 60.52, 
    'tier': 'RT'
}, 
 'LC08_L1TP_200029_20210630_20210708_02_T2': {
    'cc': 60.52, 
    'tier': 'T2'
}
}

网友
2楼 · 编辑于 2024-05-19 06:23:26

您可以使用itertools.groupby执行此任务
tiers = {'T1':1, 'RT':2, 'T2':3 } # this is the tier order import itertools data = {} by_tier = sorted( my_dict.items(), key= lambda kv: kv[1]['tier'] ) for tier,group in itertools.groupby( by_tier , key= lambda kv: kv[1]['tier']): max_item = max( group, key=lambda kv: kv[1]['cc']) data[tier] = { max_item[0] : max_item[1] }
{'RT': {'LC08_L1TP_200029_20210630_20210708_02_RT': {'cc': 60.52, 'tier': 'RT'}}, 'T1': {'LC08_L1TP_200029_20210716_20210721_02_T1': {'cc': 30.57, 'tier': 'T1'}}, 'T2': {'LC08_L1TP_200029_20210630_20210708_02_T2': {'cc': 60.52, 'tier': 'T2'}}}
问题的第一个版本
tiers = {'T1':1, 'RT':2, 'T2':3 } # this is the tier order import itertools by_tier = sorted( my_dict.items(), key= lambda kv: tiers[kv[1]['tier']] ) for tier,group in itertools.groupby( by_tier , key= lambda kv: kv[1]['tier']): print("for tier {0}".format(tier)) for item in group: print(" ==> {0}".format(item))
for tier T1 ==> ('LC08_L1TP_200029_20210716_20210721_02_T1', {'cc': 30.57, 'tier': 'T1'}) for tier RT ==> ('LC08_L1TP_200029_20210716_20210721_02_RT', {'cc': 30.57, 'tier': 'RT'}) ==> ('LC08_L1TP_200029_20210630_20210708_02_RT', {'cc': 60.52, 'tier': 'RT'}) for tier T2 ==> ('LC08_L1TP_200029_20210630_20210708_02_T2', {'cc': 60.52, 'tier': 'T2'})
现在，您可以轻松地生成所需的格式

网友
3楼 · 编辑于 2024-05-19 06:23:26

您可以按以下方式分解此问题：

获取数据集的唯一名称数据集：
从字典中提取关键字 k = list(my_dict.keys())
删除层ds = map(lamba x: x[:-2], k)
创建仅包含唯一名称的列表ds = list(set(ds))

然后浏览字典，找出字典中实际存在的键（数据集名称+层），找到可用的最佳数据集。如果按层的正确顺序执行此操作，将得到正确的结果

highest_tiers = []
for d in ds:
 for t in tiers[::-1]:
    k_t = k+t
    if k_t in list(my_dict.keys()):
       highest_tiers.append(k_t)
       break

相关问题更多 >

编程相关推荐

热门问题

热门文章