多条件分组数据帧循环

FolderName ImageName Predictions Probabilities ABC MyPet Dog 0.98 ABC HisPet Cat 0.90 DEF HerPet Bird 0.83 ABC NotPet Dog 0.23 DEF asdf Dog 0.78 DEF M123 Cat 0.19 GHI M123s Cat 0.89 GHI M13 Cat 0.19

FolderName ImageName Predictions Probabilities ABC MyPet Dog 0.98 DEF asdf Bird 0.83 GHI M123s Cat 0.89

FolderName ImageName Predictions Probabilities ABC MyPet Dog 0.98 DEF asdf Dog 0.78 GHI M123s Cat 0.89

1条回答

网友

1楼 · 发布于 2024-09-28 19:21:15

这可以通过将“预测”转换为有序的分类列，然后调用sort_values和drop_duplicates来实现。你知道吗

df['Predictions'] = pd.Categorical(
    df['Predictions'], categories=['Dog', 'Cat', 'Bird'], ordered=True)

(df.sort_values(['Predictions', 'Probabilities'], ascending=[True, False])
   .drop_duplicates('FolderName'))

  FolderName ImageName Predictions  Probabilities
0        ABC     MyPet         Dog           0.98
4        DEF      asdf         Dog           0.78
6        GHI     M123s         Cat           0.89

相关问题更多 >

编程相关推荐

热门问题

热门文章