用于在实体匹配过程中标记的python gui。

py-labeler的Python项目详细描述


皮尤贴标机

本项目旨在构建一个基于python的gui,用于手动标记 候选配对。

给出两个表A和B,目标是 em是发现两个表之间的元组对,这两个表引用 同样的现实世界实体。实体匹配涉及两个主要步骤: 分块匹配。阻塞步骤旨在消除明显的不匹配 元组对并减少要匹配的集合。实体匹配 实践涉及许多步骤,而不仅仅是阻塞和匹配。执行EM时 用户通常执行许多步骤,例如探索、清理、调试、采样, 估计精度等。但是,当前的电磁系统不包括 em pipeline,只支持几个步骤(例如阻塞、匹配),而 忽略不太知名但同样重要的步骤(例如调试、采样)。 py_entitymatching寻求支持em pipeline中涉及的所有步骤。

在匹配步骤中,用户需要检查并验证候选对是否匹配 或不匹配这是一个手动过程,这个包py_labeler提供了一个GUI来实现 更容易处理。

该软件包是免费的,开源的,并且有bsd许可。

依赖关系

生成包所需的依赖项为:

  • pandas(提供存储和管理表的数据结构)
  • pyqt5(提供构建gui的工具)
  • jinja2(为gui提供模板)

平台

py_labeler已经在linux、os x和windows上进行了测试。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
ssl证书javax。网ssl。SSLHandshakeException:java。安全cert.CertificateException:没有与IP地址匹配的主题替代名称   基于组件的体系结构的java粒度   java在读取文件中的下一行和上一行时,我得到一个空指针异常   java是什么。StrutConfig。xml。strutsdia文件?   java中如何根据枚举字段对一组对象进行排序   java Firebase setPersistenceEnabled。导致大量内存使用   java奇数编译泛型类和列表错误   java类型org没有可用的源代码。石英克隆表达;您是否忘记继承所需的模块?   java如何使用map计算列表中整数列表的和,并获得一个新列表,其中每个条目对应于每个计算出的和?   java二进制搜索不会结束   java跳过Jackson中的错误JSON数据   在服务层中使用依赖项注入时引发java空指针异常。DAO类bean为空   访问者模式如何解释这两个Java程序运行时间的差异?   用Java扩展日历   java调用通用静态方法