希瓦(https://arxiv.org/pdf/1807.03653.pdfNazabal、Olmos、Ghahramani、Valera)将其实现扩展为Python库
hivae的Python项目详细描述
希瓦
这个存储库包含由Alfredo Nazabal和同事编写的异构不完全变分自动编码器模型(HI-VAE)的模块化再实现。 这里提供的包在很大程度上是基于这个实现的,但是遵循了一种更为python的方式,省略了通过I/O提供参数的需要,以及使建模更符合sklearn。 它是由A.Karwath(a.karwath@bham.ac.uk)和F.Shalaby写的。在
此模型的详细信息包含在paper中。在
安装
可以使用pip安装软件包:
pip install hivae
示例
一旦检查出来,就有许多示例数据集(葡萄酒、成人和糖尿病),可以在./hivae/examples/data中找到。要评估包,请使用./hivae/examples/hivae_general_示例.py. 这个例子应该给出如何使用这个包的一般解释。更多细节将在下文中介绍。在
文件说明
- 你好.py:库的主脚本,它需要导入才能与库一起工作,并连接到所有其他脚本。在
- loglik\uU模型丢失_规格化.py:在本文件中,考虑的不同类型变量(实数、正、计数、分类和序数)的不同似然模型也包括在内。在
- 模型_inputDropout.py:包含带输入-丢失编码器型号的HI-VAE。在
- 模型_因子分解.py:包含带因子化编码器模型的HI-VAE
联系人
- ,有关算法的问题-->;Alfredo Nazabal:anazabal@turing.ac.uk
关于海瓦伊将军的更多细节_示例.py以及模型的使用(请注意,这正在建设中)
主目录:项目文件夹
dataset_name:数据库的名称(必需)
types_list_d:一个字典,其中键是数据集名称,其中包含一个包含元组的列表,元组指示列名、类型、维度和类的数量
类型:
•计数:实际值
•类别:类别0或1
•pos:正实值
•序数:序数
尺寸数量:
•分类变量中的可能性数量或数值变量中的1个可能性
班级数量:
•选项数量(分类变量的维度数量相同)
数据集路径:这是csv文件的文件夹
results_path:结果的输出文件夹(当前未使用)
网络路径:模型的存储位置
types\u list:要使用的数据集的特定类型 data_file:完整的数据集 训练文件/测试文件:如果数据集已经被拆分
列车数据/测试数据:熊猫数据帧
网络的深度
尺寸/尺寸:嵌入尺寸
- 项目
标签: