根据值插入特定于列的NaN并删除行

from pandas import Series, DataFrame import numpy as np A = Series(['A','A','B','B','B','C']) B = Series(['ant','flea','flea','spider','spider','flea']) C = Series([88,77,1,3,2,67]) D = Series(np.random.randn(6)) df = DataFrame({'test':A.values,'insect':B.values, 'result_1':C.values,'result_2':D.values}, columns=['test','insect','result_1','result_2']) df

1条回答

网友
1楼 · 发布于 2024-09-19 20:51:55

我想你可以用：
#add NaN by condition df.loc[df.result_1 < 10, ['result_1','result_2']] = np.nan #drop duplicated by column insect df[df.result_1.isnull()] = df[df.result_1.isnull()].drop_duplicates(subset='insect') df = df.dropna(how='all') print (df) test insect result_1 result_2 0 A ant 88.0 -0.037844 1 A flea 77.0 -1.088879 2 B flea NaN NaN 3 B spider NaN NaN 5 C flea 67.0 1.455632
另一个解决方案是找到相关索引，然后用index行^{}：
mask = df.result_1 < 10 df.loc[mask, ['result_1','result_2']] = np.nan a = df[mask].duplicated(subset='insect') print (a) 2 False 3 False 4 True dtype: bool a = a[a].index df = df.drop(a) print (df) test insect result_1 result_2 0 A ant 88.0 -0.176274 1 A flea 77.0 -0.123691 2 B flea NaN NaN 3 B spider NaN NaN 5 C flea 67.0 -0.310655

相关问题更多 >

编程相关推荐

热门问题

热门文章