如何使用列表和索引之间的比较删除列表中的项？

网友

1楼 · 编辑于 2024-10-01 11:34:18

在groupby+apply中使用筛选：

idx = set(all_cites_dog['Dog_Number'])
all_cites_dog = (all_cites_dog.groupby('Dog_Number')['Cites_Dogs']
                             .apply(lambda x: list([y for y in x if y in idx])))

print (all_cites_dog)
Dog_Number
DOG123    [DOG127]
DOG126          []
DOG127    [DOG123]
Name: Cites_Dogs, dtype: object

为了获得更好的性能，首先按^{}和^{}过滤，然后按groupby过滤，最后添加缺少的不匹配空值：

s = (all_cites_dog[all_cites_dog['Cites_Dogs'].isin(all_cites_dog['Dog_Number'].unique())]
             .groupby('Dog_Number')['Cites_Dogs']
             .apply(list))

idx = np.setdiff1d(all_cites_dog['Dog_Number'].unique(), s.index)
s1 = pd.Series([[]] * len(idx), index=idx)
print (s1)
DOG126    []
dtype: object

s = s.append(s1).sort_index()
print (s)
DOG123    [DOG127]
DOG126          []
DOG127    [DOG123]
dtype: object

网友

2楼 · 编辑于 2024-10-01 11:34:18

您可以使用apply并使用列表理解来保留索引中的元素：

l = all_cites_dog.index
all_cites_dog.apply(lambda x: [i for i in x if i in l])

Dog_Number
DOG123    [DOG127]
DOG126          []
DOG127    [DOG123]
Name: Cites_Dogs, dtype: object

网友

3楼 · 编辑于 2024-10-01 11:34:18

您可以按照以下步骤操作：

根据Cites_Dogs过滤数据帧。你知道吗
用list执行groupby+apply。你知道吗
根据唯一的狗号重新索引数据帧。你知道吗
将NaN值替换为空列表以保持一致性。你知道吗

下面是一个演示：

unq_dogs = df['Dog_Number'].unique()

res = df.loc[df['Cites_Dogs'].isin(unq_dogs]\
        .groupby('Dog_Number')['Cites_Dogs'].apply(list)\
        .reindex(unq_dogs)\
        .fillna(pd.Series([[] for _ in range(len(unq_dogs))], index=unq_dogs))\
        .reset_index()

print(res)

  Dog_Number Cites_Dogs
0     DOG123   [DOG127]
1     DOG126         []
2     DOG127   [DOG123]

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用列表和索引之间的比较删除列表中的项？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >