没有项目描述
entity-embeddings-categorical的Python项目详细描述
概述
该项目旨在利用keras框架,通过神经网络对实体嵌入进行预处理、训练和提取。它还在建造中,请小心使用。
安装
如果您的计算机上已经安装了virtualenv,那么安装非常简单。如果你不愿意,请依靠VirtualEnv official documentation。
pip install entity-embeddings-categorical
文档
除了docstring之外,还可以找到文档的主要细节here。
测试
<>这个项目是为了适应大多数现存的需求,因此,可测试性是一个主要的关注点。大多数代码都经过了严格的测试,连同Travis作为一个连续的集成工具,一旦有了新的提交,就可以运行所有的单元测试。用法
此实用程序库的使用有两种模式:默认和自定义。在默认配置中,可以执行以下操作:回归、二进制分类和多类分类。
如果您的数据类型与这些类型中的任何一种不同,您可以随意使用自定义模式,在该模式中,您可以定义与目标处理和神经网络输出相关的大多数配置。
默认模式
默认模式的使用非常简单,您只需要为config对象提供一些参数:
因此,为了创建一个简单的嵌入网络,该网络从文件sales_last戋u terminal.csv读取,目标名称为total戋u sales,期望输出为binary classification,训练比率为0.9,我们的python脚本将如下所示:
config=Config.make_default_config(csv_path='sales_last_semester.csv',target_name='total_sales',target_type=TargetType.BINARY_CLASSIFICATION,train_ratio=0.9)embedder=Embedder(config)embedder.perform_embedding()
很简单吧?
可以找到默认模式的工作示例here as a Python script。
自定义模式
如果你想定制神经网络的输出,甚至是目标变量的处理方式,你需要在创建配置对象时指定这些。 这可以通过创建一个扩展自TargetProcessor和ModelAssembler的类来完成。
可以找到自定义配置模式的工作示例here。
可视化
完成模型的训练后,可以使用模块visualization_utils,以便根据生成的权重和模型的准确性创建一些可视化效果。
下面是为Rossmann dataset创建的一些示例:
故障排除
如果项目有任何问题,或者需要进一步的问题,请毫不犹豫地在github上打开一个问题。
贡献
我们非常欢迎您的贡献,因此请随时打开一个拉取请求:-)