相似性度量实用程序包
Categorical-similarity-measures的Python项目详细描述
确定两个对象之间的相似性或距离是多个数据挖掘和知识发现任务的关键步骤。对于定量数据,Minkowski距离在确定两个实体之间的距离方面起着重要作用。通常已知和使用的相似性度量是曼哈顿距离,它是1阶的Minkowski距离,而欧几里德距离是2阶的Minkowski距离。但是,在范畴数据的情况下,我们知道不存在先天的顺序,这使得寻找两个范畴点之间的距离变得困难。这是一个实用程序包,用于查找相似性度量,如Eskin、IOF、OF、Overlap(简单匹配)、Goodall1、Goodall2、Goodall3、Goodall4、Lin、Lin1、Morlini_Zani(S2)、变量熵和变量可变性。这些相似性度量有助于找到包含分类数据的两个或多个对象或实体之间的距离。在
- 项目
标签: