将余弦相似性转换为各自的字符串

2024-06-26 14:00:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在做一个基于许多字符串句子的余弦相似性的聚类。 例如,字符串a和字符串b的余弦相似性接近字符串c和字符串b。 聚类方法将以列表形式将它们分组,但要分组的值是两个余弦值。你知道吗

我希望在分组中显示实际字符串本身。但是我的聚类方法只接受余弦相似度值。 有没有办法把它们转换回初始字符串?你知道吗

MyClusters = HierarchicalClustering(List_of_cosine_values, lambda x,y: abs(x-y))
grouping = MyClusters.getlevel(0.018)

Tags: of方法字符串列表聚类相似性形式list