我正在做一个基于许多字符串句子的余弦相似性的聚类。
例如,字符串a和字符串b的余弦相似性接近字符串c和字符串b。
聚类方法将以列表形式将它们分组,但要分组的值是两个余弦值。你知道吗
我希望在分组中显示实际字符串本身。但是我的聚类方法只接受余弦相似度值。
有没有办法把它们转换回初始字符串?你知道吗
MyClusters = HierarchicalClustering(List_of_cosine_values, lambda x,y: abs(x-y))
grouping = MyClusters.getlevel(0.018)
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐