Pandas每行两列集合的差异

2024-09-30 14:27:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个dataframe unique\u ID,每个时间步有两列,表示每个时间步两个不同ID的唯一值

Dataframe

我想知道有多少个ID在txId1的集合中,而不是在txId2的集合中

我试过: unique_ids['diff']=np.setdiff1d(unique_ids['txId1'], unique_ids['txId2']) 这给了我值错误:操作数不能与形状(1754,)(6672,)一起广播

for idx, row in unique_ids.iterrows(): unique_ids.loc[idx, 'diff'] = np.setdiff1d(row['txId1'],row['txId1']) 这给了我ValueError:当使用iterable设置时,必须有相等的len键和值

工作原理是: np.setdiff1d(unique_ids.loc[1,'txId1'], unique_ids.loc[1,'txId2'])这就是为什么我不明白为什么上面的选项不起作用

数据帧没有NaN值


Tags: ididsdataframe错误np时间diffloc