如何计算标签之间的相似性？

2024-06-25 22:54:26 发布

您现在位置：Python中文网/ 问答频道 /正文

743

网友

男 | 程序猿一只，喜欢编程写python代码。

我已经开始解决Python编程集体智能一书中的一些练习。问题二是：使用德尔伊西奥乌斯API，创建标记和项的数据集。用这个来计算标签之间的相似性，看看是否能找到几乎相同的标签。但有些项目是“找不到”的。在

到目前为止，我创建了一个字典，用于解析名为txt标签. 在

def asd():
d = dict()
for line in open("tags.txt"):
    if len(line.strip().split("\t")) == 23:
        url, number_of_saves, data_of_first_save, tag1, tagCount1, tag2, tagCount2, tag3, tagCount3, tag4, tagCount4, tag5,tagCount5,\
        tag6, tagCount6, tag7, tagCount7, tag8, tagCount8, tag9, tagCount9, tag10, tagCount10 = line.strip().split("\t")
        tags = [tag1,tag2,tag3,tag4,tag5,tag6,tag7,tag8,tag9,tag10]
        tagCounts = [tagCount1,tagCount2,tagCount3,tagCount4,tagCount5,tagCount6,tagCount7,tagCount8,tagCount9,tagCount10]
        d.setdefault(url, {})
        for index, tag in enumerate(tags):
            d[url][tag] = tagCounts[index]
return d

我的问题是如何使用这本词典找出标签之间的相似之处？在

Tags： of in txt url for line tags 标签

1条回答

网友

1楼 · 发布于 2024-06-25 22:54:26

"Use this to calculate similarity between tags"
"almost identical"

考虑Levenshtein distance：“Levenshtein distance是一个字符串度量，用于测量两个序列之间的差异”。在

如何计算标签之间的相似性？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何计算标签之间的相似性？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >