combine_first似乎对数据帧没有任何影响

df=pd.DataFrame({'JobNumber':[647,647,817,817,817, 915,915,915],'Column6':['KT35','KT35','KT35','KT35','KT35','KT35','KT35','KT35'], 'Column7':[0, 1, 0, 0 , 4, 1, 0, 0],'Column8':[1.5, 0 ,0 ,1.7,0,0,0,1], 'Column9':[0,0,1,0,0,0,2.03,0]})

df2 = pd.read_excel(file.xlsx) df2.columns=['JobNumber','Column6','Column7','Column8','Column9'] df3 = df2.loc[[0],:] for i in range(len(df2.JobNumber)): JobNum = df2.iloc[i, 0] if df2.iloc[i,0] == df2.iloc[i-1, 0]: df3.loc[df3.JobNumber == JobNum,:] = df3.loc[df3.JobNumber == JobNum,:].combine_first(df2.iloc[[i],:]) else: df3.append(df2.iloc[i,:])

2条回答

网友

1楼 · 编辑于 2024-09-30 02:33:19

我会用NaN来填补空白''

df.replace('', np.nan)

我会同时使用{}和{}

然后删除.duplicates()

请参阅下面的模拟数据和解决方案。我所做的就是将上述方法链接在一起

数据

    df=pd.DataFrame({'Column5':[647,647,817,817],'Column6':['KT35','KT35','KT35','KT35'],'Column7':['',1,'',1],'Column8':[1.5,'',2,''], 'Column9':['','','','']})
print(df)


    Column5 Column6 Column7 Column8 Column9
0      647    KT35             1.5        
1      647    KT35       1                
2      817    KT35               2        
3      817    KT35       1     

df=df.replace('', np.nan).ffill().bfill().drop_duplicates(keep='first')
print(df)


   Column5 Column6  Column7  Column8  Column9
0      647    KT35      1.0      1.5      NaN
2      817    KT35      1.0      2.0      NaN

网友

2楼 · 编辑于 2024-09-30 02:33:19

我不确定这一点的范围，但如果它在这两个列之间交替出现，如所提供的示例中所示，下面的代码应该可以工作

df['col8'] = df['col8'].shift()
df = df.dropna(subset=['col8'])

相关问题更多 >

编程相关推荐

热门问题

热门文章