一个多输入截尾数据的库
censor-fix的Python项目详细描述
审查程序
请看网站https://censor-fix.readthedocs.io/en/latest/
对经过审查的数据进行多重归罪的图书馆。
该软件利用概率规划语言(ppl)stan对截尾数据进行多重插补。 对于1D插补,库可以拟合数据分布以创建插补。
对于具有许多功能的缺失数据,库可以循环使用其他功能对经过审查的值进行建模
使用方法:
数据需要在pandas数据框中,并且必须指定需要输入的列。 除非另有说明,否则假设数据具有正态分布,但数据有均匀分布、t分布或指数分布的选项。要使数据更正常,可以尝试使用sklearn.reprocessing.power_转换使数据正常。