用于执行字符串相似性联接的python库。

py-stringsimjoin的Python项目详细描述


py_stringsimjoin

本项目旨在构建一个python软件包,为jaccard、dice、cosine、overlap、overlap coefficient和edit distance等常用的相似度度量提供两个表上字符串相似度连接的可伸缩实现。该软件包是免费的,开源的,并且有bsd许可。

依赖关系

py_stringsimjoin已经在python 2.7、3.5+上进行了测试。

构建包所需的依赖项是pandas 0.16.0或更高版本,py_stringmatching 0.2.1或更高版本, JoopLIB、PyPrimd、六和C++编译器。对于开发版本,您还需要cython。

平台

py_stringsimjoin已经在linux、os x和windows上进行了测试。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
ssl证书javax。网ssl。SSLHandshakeException:java。安全cert.CertificateException:没有与IP地址匹配的主题替代名称   基于组件的体系结构的java粒度   java在读取文件中的下一行和上一行时,我得到一个空指针异常   java是什么。StrutConfig。xml。strutsdia文件?   java中如何根据枚举字段对一组对象进行排序   java Firebase setPersistenceEnabled。导致大量内存使用   java奇数编译泛型类和列表错误   java类型org没有可用的源代码。石英克隆表达;您是否忘记继承所需的模块?   java如何使用map计算列表中整数列表的和,并获得一个新列表,其中每个条目对应于每个计算出的和?   java二进制搜索不会结束   java跳过Jackson中的错误JSON数据   在服务层中使用依赖项注入时引发java空指针异常。DAO类bean为空   访问者模式如何解释这两个Java程序运行时间的差异?   用Java扩展日历   java调用通用静态方法