比较dataframe中的多列（多于2列）

3条回答

网友

1楼 · 编辑于 2024-09-29 21:31:39

我们可以^{}类rank列，然后沿axis=1使用^{}检查N唯一值的出现

r = data.filter(like='rank')
data['diff'] = r.nunique(1).eq(r.shape[1]).view('i1')

  student  rank  rank1  rank2  diff
0       a     2      3      4     1
1       b     2      3      2     0
2       c     1      2      3     1

网友

2楼 · 编辑于 2024-09-29 21:31:39

您可以使用set()并检查由所有列值构造的集合的长度是否=3：

data["Diff"] = (
    data[["rank", "rank1", "rank2"]]
    .apply(lambda x: len(set(x)) == 3, axis=1)
    .astype(int)
)
print(data)

印刷品：

  student  rank  rank1  rank2  Diff
0       a     2      3      4     1
1       b     2      3      2     0
2       c     1      2      3     1

网友

3楼 · 编辑于 2024-09-29 21:31:39

让我们试试pd.Series.unique和let

data['new'] = data.filter(like='rank').apply(pd.Series.unique,1).str.len().eq(3).astype(int)

Out[45]: 
0    1
1    0
2    1
dtype: int64