KnowSim,知道你的相似之处

knowsim的Python项目详细描述


知识

知道,知道你的意思

文本相似度计算器

Cossine,Simhash,Minhash相似度计算器

Pypi版本下载Pypi和Github许可语言 Pypi VersionDownloadsPypi and Github LicenseLanguage

Knowsim的优势在于:

  • 关注文本相似度比较
  • 采用余弦计算和simhash算法
  • 100%Python语言
  • 自动TFIDF筛选
  • TF和IDF可以分开计算
  • 支持列表和文件
  • 支持多文件相似度比较
  • 高效快捷
  • 易于安装
  • 100%开源
  • 长期维护和更新

下载并安装

PIP安装:

$ pip3 install knowsim

如果在中国发展缓慢,你可以用清华的形象:

^{pr2}$

使用方法

计算文本相似度

余弦相似性
importknowsimasksks.cossim(Input1,Input2)
Simhash和Minhash相似性
importknowsimasks# Simhashks.simhash(Input1,Input2)# Minhashks.minhash(Input1,Input2)
  • 在计算文本相似度时,由TFIDF自动过滤
  • Input1-第一个输入值,可以是文件或列表的地址
  • Input2-第二个输入值,可以是文件或列表的地址
计算TF,IDF,TFIDF
importknowsimasksks.GetTF(Input)ks.GetIDF(Input)ks.GetTFIDFInput)
  • 输入-输入值,可以是文件或列表的地址
  • 用于计算文本相似性的输入类型
  • 目前支持两种熟人类型:档案和列表档案

MIT许可证

版权所有(c)[2020][Kiwirafe]

兹免费准许任何人取得复制品 本软件及其相关文档文件(“软件”)的 在软件中不受限制,包括但不限于权利 使用、复制、修改、合并、发布、分发、再授权和/或出售 软件的副本,并允许软件的使用者 根据以下条件提供:

上述版权声明和本许可声明应包括在所有 软件的副本或大部分。在

本软件按“原样”提供,无任何形式的保证,明示或 包括但不限于适销性保证, 特定目的的适用性和非侵犯性。在任何情况下 作者或版权持有人应对任何索赔、损害赔偿或其他 无论是在合同诉讼、侵权诉讼或其他诉讼中,由以下原因引起的责任:, 与软件、软件的使用或其他交易有关 软件。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java广播接收器未检测到按键事件   java不为特定列更改创建修订   java采用了更实用的方法   java桌面窗格HTML呈现   java处理internet连接丢失   java在调整JFrame的大小时,如何防止JTable的列调整大小?   如何用Java中的“Scanner.hasNext”完成程序   具有模块名称的java停止IntelliJ项目工具窗口?   执行已编译的Rails-Warbler JAR文件时发生java加载错误   java Spring数据redis存储库不支持集合查询?   每个客户端的java队列请求   获取Java中的JSON嵌套数组元素   java GWT,Vaadin ConcurrentModificationException   firebase存储中的java在保存照片之前,我需要发送两次照片   JavaSpringEleaf如何在容器外使用变量