一种基于贝叶斯网络的缺失值填补方法
PyMissingData的Python项目详细描述
为了充分利用所有可用的信息,最好使用尽可能多的可用目录。例如,在根据类星体的可变性对其进行分类时添加u波段或x射线信息,很可能会提高整体性能。 由于这些目录是用不同的工具、带宽、位置、时间等获取的,因此这些目录的交集比任何单个目录都小;因此,生成的多目录包含缺少的值。传统的分类方法不能很好地解决数据丢失的问题,因为训练一个分类模型需要所有训练成员具有所有的特征。 pymissingdata允许您根据观察到的数据和变量之间的依赖关系预测丢失的值。