在python数据帧中删除列中不包含特定字符串的多个列的重复项

2024-09-24 06:22:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我想删除仅限于C2和C3列的副本。但是,现在在为重复项保留行时,列C4中以“zx”开头的行应该被赋予优先级。例如:考虑第0行和第1行(指C1列),行“0”保留在输出中,因为它包含“zx”,但C4被删除。另外,当两个副本包含相同的“zx”时,例如第6行和第7行,任何人都可以被删除。但是,当重复行(对于列C2和C3)包含不同的“zx”时,两者都应保留例如: 第8排和第9排。在

输入:

C1  C2   C3   C4
0   AB   Dat  zx101
1   AB   Dat  tp102
2   CD   CR   zx1032
3   CD   CR   lx1032
4   EF   KLM  2x501
5   EF   KLM  2x501
6   HI   NOP  zx707
7   HI   NOP  zx707
8   PL   TIP  zx303
9   PL   TIP  zx304

输出:

^{pr2}$

Tags: ab副本cdhinopdatcrc2