我有一个类似于此的数据框(注意,这是一个示例,我的实际数据框有数千行和数百个组)
pd.DataFrame({'a':['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
'year':[2018, 2019, 2020, 2018, 2020, 2018, 2019, 2020],
'c':[1, 2, 4, 2, 4, 4, 4, 3]})
a year c
0 A 2018 1
1 A 2019 2
2 A 2020 4
3 B 2018 2
4 B 2020 4
5 C 2018 4
6 C 2019 4
7 C 2020 3
我需要检查“a”列中每个组的以下条件:
如果这两个条件都为真,我想在该组的“d”列中设置一个“真”值
a year c d
0 A 2018 1 TRUE
1 A 2019 2 TRUE
2 A 2020 4 TRUE
3 B 2018 2 FALSE
4 B 2020 4 FALSE
5 C 2018 4 FALSE
6 C 2019 4 FALSE
7 C 2020 3 FALSE
在我的例子中,只有A组满足这两个条件。B组没有2019年的数据,C组的值从一年到下一年没有增加
我试过群比,但没有成功。我认为这需要时间,但不知道如何开始
我们可以用
apply
+reindex
做条件相关问题 更多 >
编程相关推荐