python的模糊匹配聚类库。

fog的Python项目详细描述


Build Status

python的模糊匹配/聚类库。

安装

可以使用pip通过以下命令安装fog

pip install fog

用法

指标

稀疏余弦相似性

计算两个稀疏加权集的余弦相似性。这些集合必须表示为计数器。

fromfog.metricsimportsparse_cosine_similarity# Basicsparse_cosine_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.062

参数

  • acounter:第一加权集。必须是将键映射到权重的字典。
  • bcounter:第二加权集。应该是一本字典,将键映射到权重。

雅卡相似性

计算两个任意iterable的jaccard相似性。

fromfog.metricsimportjaccard_similarity# Basicjaccard_similarity('context','contact')>>>~0.571

参数

  • aiterable:要比较的第一个序列。
  • biterable:要比较的第二个序列。

加权相似性

计算两个加权集的加权jaccard相似性。这些集合必须表示为计数器。

fromfog.metricsimportweighted_jaccard_similarity# Basicweighted_jaccard_similarity({'apple':34,'pear':3},{'pear':1,'orange':1})>>>~0.026

参数

  • acounter:第一加权集。必须是将键映射到权重的字典。
  • bcounter:第二加权集。应该是一本字典,将键映射到权重。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
带条纹的java开源CMS?   Java中的模板类   java为我的圣诞树建造底座   算法首次用户输入尝试不起作用(Java)   简单服务器客户端程序中的java EOF和SocketException   java的OpenJPA与OSGi配合使用吗   arraylist中的java排序   Java工具创建的WSDL文件存在WCF序列化问题   java公共布尔removeStudent(int-id)   正则表达式java正则表达式需要字符串验证   JavaSpring任务调度   java表“places”没有名为“smallDesc”的列   java将枚举集转换为整数数组   java将int数组转换为byte数组,反之亦然,最有效的方法是什么?   java错误:找不到适合添加的方法(字符串,类<RouterRequestManagerFragment>)   java JComponent不可见   javasocket编程中线程“awteventque0”java.lang.NullPointerException“异常”错误