Python:如何为datafram的每行选择两个相等的列

2024-10-01 02:18:15 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的数据帧“dfm”:

match   org_o                         group 
012       012 Smile Communications     92   
012       012 Smile                    92   
10types   10TYPES                      93   
10types   10types.com                  93   
360works  360WORKS                     94   
360works  360works.com                 94   
400 IBM   AS/400 Division              36   
6c f3f    IBM Internal US Division     36   

我要选择具有相同“组”号和相同“匹配”号的行。结果如下:

   match    org_o                         group 
    012       012 Smile Communications     92   
    012       012 Smile                    92   
    10types   10TYPES                      93   
    10types   10types.com                  93   
    360works  360WORKS                     94   
    360works  360works.com                 94

有人知道我怎样才能在大熊猫里做吗?你知道吗


Tags: 数据orgcomasmatchgroupibmdivision
1条回答
网友
1楼 · 发布于 2024-10-01 02:18:15

对'group'和'match'执行groupby,然后对'org\o'>;1的计数执行filter

In [245]:

df.groupby(['group', 'match']).filter(lambda x: x['org_o'].count() > 1)
Out[245]:
      match                     org_o  group
0       012  012 Smile Communications     92
1       012                 012 Smile     92
2   10types                   10TYPES     93
3   10types               10types.com     93
4  360works                  360WORKS     94
5  360works              360works.com     94

相关问题 更多 >