填充数据框中缺少的值

1条回答

网友

1楼 · 发布于 2024-09-29 09:29:24

将^{}用于具有相同大小（如原始大小）的系列，由聚合值填充max：

df1['locationid']=df1.locationid.fillna(df1.groupby('geo_loc')['locationid'].transform('max'))
print (df1)
   locationid geo_loc
0       111.0     G12
1       158.0     K11
2       145.0     B16
3       111.0     G12
4       189.0     B22
5       145.0     B16
6       158.0     K11
7       145.0     B16

如果可以通过在lambda函数中使用^{}技巧移除缺失的值来实现值为字符串，则字符串将按字典顺序进行比较：

df1 = pd.DataFrame({'locationid':[111, np.nan, 145, np.nan, 189,np.nan, 158, 145],
                     'geo_loc':['G12','K11','B16','G12','B22','B16', 'K11', 'B16']})

#sample data strings with missing values
df1['locationid'] = df1['locationid'].dropna().astype(str) + 'a'


df1['locationid']= (df1.groupby('geo_loc')['locationid']
                       .transform(lambda x: x.fillna(x.dropna().max())))

print (df1)
  locationid geo_loc
0     111.0a     G12
1     158.0a     K11
2     145.0a     B16
3     111.0a     G12
4     189.0a     B22
5     145.0a     B16
6     158.0a     K11
7     145.0a     B16

相关问题更多 >

编程相关推荐

热门问题

热门文章

填充数据框中缺少的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >