填充pandas datafram中缺少的行值

2024-10-03 17:15:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有下面的数据帧,我想填补缺失的值。在

mukey   hzdept_r    hzdepb_r    sandtotal_r silttotal_r
425897      0         61        
425897      61        152          5.3         44.7
425911      0         30           30.1        54.9
425911      30        74           17.7        49.8
425911      74        84        

我希望每个缺失的值都是对应于该mukey的值的平均值。在这种情况下,例如,第一行缺失值将是mukey==425897的sandtool_r和silttotal_r的平均值。熊猫菲尔娜似乎没有做到这一点。有什么帮助吗?在


Tags: 数据情况平均值sandtotalhzdepthzdepbmukeysilttotal
1条回答
网友
1楼 · 发布于 2024-10-03 17:15:48

用我刚学到的东西,下面几个问题。。。。在

仅供参考,此解决方案仍会将NaN留给没有任何“sandtotal”或“silttotal”的“Mukey”

import pandas as pd

df = pd.read_clipboard()

df1 = df.set_index('mukey')

df1.fillna(df.groupby('mukey').mean(),inplace=True)

df1.reset_index()

    mukey  hzdept_r  hzdepb_r  sandtotal_r  silttotal_r
0  425897         0        61          5.3        44.70
1  425897        61       152          5.3        44.70
2  425911         0        30         30.1        54.90
3  425911        30        74         17.7        49.80
4  425911        74        84         23.9        52.35

相关问题 更多 >