我正在学习中级机器学习课程中的Kaggle笔记本“缺失值”。
我正在使用SimpleImputer
对数据帧进行预处理。需要插补3列。我以同样的方式将SimpleImputer
应用于它们中的每一个。
是否有办法对每一列分别使用不同的策略(平均值、中位数…)
以下是我目前的情况:
imputer = SimpleImputer(strategy = 'median')
imputed_X_train = pd.DataFrame(imputer.fit_transform(X_train))
imputed_X_valid = pd.DataFrame(imputer.transform(X_valid))
是的,您应该使用^{} 。这将对
median_columns_list
中的列应用中值插补器,对mean_columns_list
中的列应用平均插补器:相关问题 更多 >
编程相关推荐