如何使用Python填充和填充Dataframe中每个组的缺失值？

df = Name Type Price 0 gg apartment 8 1 hh apartment 4 2 tty apartment 0 3 ttyt None 6 4 re house 6 5 ew house 2 6 rr house 0 7 tr None 5 8 mm None 0

0 gg apartment 8 1 hh apartment 4 2 tty apartment 6 # (8+4)/2 = 6 3 ttyt NoInfo 6 4 re house 6 5 ew house 2 6 rr house 4 # (6+2)/2 = 4 7 tr NoInfo 5 8 mm NoInfo 0

1条回答

网友

1楼 · 发布于 2024-10-03 15:23:31

在pandas中，可以使用replace()将缺少的值替换为NaN。然后你可以用组平均数来计算它们。最后，您可以使用函数zscore从scipy的stats模块计算价格的z分数。在

代码如下：

import numpy as np
import pandas as pd
from scipy.stats import zscore


df = pd.read_csv('./data.csv')

df['price'] = df['price'].replace(0, np.nan)
df['price'] = df.groupby('type').transform(lambda x: x.fillna(x.mean()))

df['price_zscore'] = df[['price']].apply(zscore) # You need to apply score function on a DataFrame—not a Series.

编程相关推荐

试图从数组返回的列表中删除时出现java UnsupportedOperationException。asList
JAVA搜索列表字段
Java将布尔[]转换为十进制
为什么这个循环会在Java中反转字符串
Arraylist索引计算java
java如何在不知道值的情况下选择selenium中的复选框
Java如何在for循环中使用getter？
java不希望下载和检索XML
java读取csv文件，并在值本身中指定分隔符
java如何使字符串在循环中第二次不可用？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Python填充和填充Dataframe中每个组的缺失值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >