我想删除仅限于C2和C3列的副本。但是,现在在为重复项保留行时,列C4中以“zx”开头的行应该被赋予优先级。例如:考虑第0行和第1行(指C1列),行“0”保留在输出中,因为它包含“zx”,但C4被删除。另外,当两个副本包含相同的“zx”时,例如第6行和第7行,任何人都可以被删除。但是,当重复行(对于列C2和C3)包含不同的“zx”时,两者都应保留例如: 第8排和第9排。在
输入:
C1 C2 C3 C4
0 AB Dat zx101
1 AB Dat tp102
2 CD CR zx1032
3 CD CR lx1032
4 EF KLM 2x501
5 EF KLM 2x501
6 HI NOP zx707
7 HI NOP zx707
8 PL TIP zx303
9 PL TIP zx304
输出:
^{pr2}$
自然的方法是
drop_duplicates( keep = 'first')
相关问题 更多 >
编程相关推荐