Python：基于包含多个列值的多个列表筛选行

Index product_id return_reason col3 col4 col5 1 A0001 Size_too_big string31 string41 string51 2 A0001 Size_too_big string32 string42 string52 3 A0001 Defective string33 string43 string53 4 B0002 Defective string34 string44 string54 5 B0002 Defective string35 string45 string55 6 B0002 Changed_mind string36 string46 string56 7 C0003 Size_small string37 string47 string57 8 D0004 Size_small string38 string48 string58 9 D0004 Size_too_big string39 string49 string59 10 D0004 Size_small string310 string410 string510

Index product_id return_reason col3 col4 col5 1 A0001 Size_too_big string31 string41 string51 2 A0001 Size_too_big string32 string42 string52 4 B0002 Defective string34 string44 string54 5 B0002 Defective string35 string45 string55 8 D0004 Size_small string38 string48 string58 10 D0004 Size_small string310 string410 string510

Index product_id return_reason col3 col4 col5 1 A0001 Size_too_big string31 string41 string51 2 A0001 Size_too_big string32 string42 string52 3 A0001 Defective string33 string43 string53 4 B0002 Defective string34 string44 string54 5 B0002 Defective string35 string45 string55 8 D0004 Size_small string38 string48 string58 9 D0004 Size_too_big string39 string49 string59 10 D0004 Size_small string310 string410 string510

1条回答

网友

1楼 · 发布于 2024-10-01 19:24:08

如果需要所有行都被2列复制，请在^{}中使用^{}和keep=False：

df = df[df.duplicated(['product_id', 'return_reason'], keep=False)]
print (df)
   Index product_id return_reason       col3       col4       col5
0      1      A0001  Size_too_big   string31   string41   string51
1      2      A0001  Size_too_big   string32   string42   string52
3      4      B0002     Defective   string34   string44   string54
4      5      B0002     Defective   string35   string45   string55
7      8      D0004    Size_small   string38   string48   string58
9     10      D0004    Size_small  string310  string410  string510

或者，如果需要按^{}按^{}按^{}按^{}过滤的2行2列的行：

df = df[df.groupby(['product_id', 'return_reason'])['product_id'].transform('size').eq(2)]
print (df)
   Index product_id return_reason       col3       col4       col5
0      1      A0001  Size_too_big   string31   string41   string51
1      2      A0001  Size_too_big   string32   string42   string52
3      4      B0002     Defective   string34   string44   string54
4      5      B0002     Defective   string35   string45   string55
7      8      D0004    Size_small   string38   string48   string58
9     10      D0004    Size_small  string310  string410  string510

相关问题更多 >

编程相关推荐

热门问题

热门文章