没有项目描述

entity-embeddings-categorical的Python项目详细描述


PyPI versionBuild StatusCoverage StatusGitHubCodacy Badge

概述

该项目旨在利用keras框架,通过神经网络对实体嵌入进行预处理、训练和提取。它还在建造中,请小心使用。

安装

如果您的计算机上已经安装了virtualenv,那么安装非常简单。如果你不愿意,请依靠VirtualEnv official documentation

pip install entity-embeddings-categorical

文档

除了docstring之外,还可以找到文档的主要细节here

测试

<>这个项目是为了适应大多数现存的需求,因此,可测试性是一个主要的关注点。大多数代码都经过了严格的测试,连同Travis作为一个连续的集成工具,一旦有了新的提交,就可以运行所有的单元测试。

用法

此实用程序库的使用有两种模式:默认和自定义。在默认配置中,可以执行以下操作:回归、二进制分类和多类分类。

如果您的数据类型与这些类型中的任何一种不同,您可以随意使用自定义模式,在该模式中,您可以定义与目标处理和神经网络输出相关的大多数配置。

默认模式

默认模式的使用非常简单,您只需要为config对象提供一些参数:

因此,为了创建一个简单的嵌入网络,该网络从文件sales_last戋u terminal.csv读取,目标名称为total戋u sales,期望输出为binary classification,训练比率为0.9,我们的python脚本将如下所示:

config=Config.make_default_config(csv_path='sales_last_semester.csv',target_name='total_sales',target_type=TargetType.BINARY_CLASSIFICATION,train_ratio=0.9)embedder=Embedder(config)embedder.perform_embedding()

很简单吧?

可以找到默认模式的工作示例here as a Python script

自定义模式

如果你想定制神经网络的输出,甚至是目标变量的处理方式,你需要在创建配置对象时指定这些。 这可以通过创建一个扩展自TargetProcessorModelAssembler的类来完成。

可以找到自定义配置模式的工作示例here

可视化

完成模型的训练后,可以使用模块visualization_utils,以便根据生成的权重和模型的准确性创建一些可视化效果。

下面是为Rossmann dataset创建的一些示例:

Weights for store id embedding

故障排除

如果项目有任何问题,或者需要进一步的问题,请毫不犹豫地在github上打开一个问题。

贡献

我们非常欢迎您的贡献,因此请随时打开一个拉取请求:-)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java正在寻找Java8中的内置函数以忽略异常   javascript JQuery更改Div的颜色   java PostgreSQL使用JDBC写入inet列   java为什么体重指数计算结果不正确?   java禁用linux中的log4j控制台日志记录   java我可以让我的JMS主题在新订阅者连接时通知发布者(使用ActiveMQ)   基于三个浮点输入的java过滤器JTable?   Java OpenGL/LWJGL体素纹理   在SpringBoot java应用程序中,有没有一种方法可以通过不同的机器使用hostIP作为主机远程连接到redis服务器   java Struts 2 s:提交按钮语法以在映射中设置值   java源代码:setDomainEnv。windows 7中的cmd文件   缺少货币计算java的返回语句   JavaHibernate没有注意到从其他源进行的数据库更新   无法在OpenCV/Java中生成负矩阵   Java不做循环   java无法使用类对象写入文件ArrayList   jpa使用数组作为调用Java的存储过程的输入   java使用文件提供程序检索内容Uri失败   需要java程序来创建方法模板