我有这样一个数据帧:
StringCol Timestamp GroupID Flag
xyz 20170101 123 yes
abc 20170101 123 yes
def 20170101 123 yes
ghi 20170101 123 no
abc 20170101 124 yes
jkl 20170101 124 yes
pqr 20170101 124 no
klm 20170101 124 yes
我想按GroupID对其进行分组,对于每个组,我想将标记为“no”的行和前面的X行数(dataframe已经按GroupID和Timestamp排序)
所以,如果X=2,我希望结果是这样的:
StringCol Timestamp GroupID Flag
abc 20170101 123 yes
def 20170101 123 yes
ghi 20170101 123 no
abc 20170101 124 yes
jkl 20170101 124 yes
pqr 20170101 124 no
我如何做到这一点?谢谢
这将获取每个组最后一个标志的前X项
如果您只需要组中的最后一个no,请尝试
drop_duplicates
相关问题 更多 >
编程相关推荐