根据python中的条件选择行

'ID' 'Title' 'Category' 'Company' 'Field' 0 ABD12567 Title1 Company1 1 ABD12567 Title1 N/A Field1 2 ABD12567 Title1 Category1 Company1 Field1 3 ABD12567 Title1 Company1 4 ABD12567 Title1 N/A Company1 Field1

1条回答

网友

1楼 · 发布于 2024-10-04 09:29:40

您可以使用(~df.isin(["", "N/A"])).sum(1)通过对axis=1上的布尔值求和来获取行中有效值的数量。将其与groupby和idxmax结合使用：

示例数据（添加了一个额外的ID以显示groupby）：

  ID             Title      Category       Company       Field
0 ABD12567       Title1                    Company1   
1 ABD12567       Title1     N/A                          Field1
2 ABD12567       Title1     Category1      Company1      Field1
3 ABD12567       Title1                    Company1   
4 ABD12567       Title1     N/A            Company1      Field1
5 ABD12568       Title1     N/A            Company1      Field1

代码：

idx = (df.assign(max=(~df.isin(["", "N/A"])).sum(1)) # assign temp column
         .groupby("ID")["max"].idxmax()) #retrieve index of max value within each group

print (df.loc[idx])

         ID   Title   Category   Company   Field
2  ABD12567  Title1  Category1  Company1  Field1
5  ABD12568  Title1        N/A  Company1  Field1

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据python中的条件选择行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >