比较数据帧中每列的前一行值

2024-09-27 04:19:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个类似的问题

我有一个数据框,其中有一个ID列和一个计数器列,用于此想法,如下所示:

ID counter valueA   valueB
A   1       10        1
A   2       10        1
A   3       5         1
B   1       1         2
B   2       1         3
B   3       2         4
B   4       3         4
...

如何在dataframe中以1计算每列的行更改,使dataframe看起来像:

ID counter valueA   valueB
A   1       0         0
A   2       0         0
A   3       1         0
B   1       0         0
B   2       0         1
B   3       1         1
B   4       1         1
...

因此,每次列中的值发生变化时(仅当它是相同的ID时,计数器不应被标记),我都会得到一个带有1的标记。请注意,我有更多的值列,这两个只是一个示例


Tags: 数据标记id示例dataframecounter计数器valueb
1条回答
网友
1楼 · 发布于 2024-09-27 04:19:27

使用:

df = pd.DataFrame({'ID': ['A', 'A', 'A', 'B', 'B', 'B', 'B'], 'counter': [1, 2, 3, 1, 2, 3, 4], 'valueA': [10, 10, 5, 1, 1, 2, 3], 'valueB': [1, 1, 1, 2, 3, 4, 4]})

打印(df)


c = ['valueA','valueB']
df[c] = df[c].ne(df[c].groupby(df['ID']).shift().bfill()).astype(int)
print (df)
  ID  counter  valueA  valueB
0  A        1       0       0
1  A        2       0       0
2  A        3       1       0
3  B        1       0       0
4  B        2       0       1
5  B        3       1       1
6  B        4       1       0

对于每组计数器,我尝试此解决方案,但输出仍然不同:

df[c] = df[c].ne(df[c].groupby(df['ID']).shift().bfill()).groupby(df['ID']).cumsum()
print (df)
  ID  counter  valueA  valueB
0  A        1       0       0
1  A        2       0       0
2  A        3       1       0
3  B        1       0       0
4  B        2       0       1
5  B        3       1       2
6  B        4       2       2

注意:为了成功,应安装最新的pandas版本

相关问题 更多 >

    热门问题