计算两者之间的相似性txt文件

1条回答

网友

1楼 · 发布于 2024-09-29 17:17:05

一个简单的解决方案是，在读取文件并将其拆分为单词后，只需循环浏览这些文件，首先将它们分配到字典以计算每个文件出现的次数，然后计算相对比率，检查哪些单词同时出现在两个文件中，并计算最终比率：

temp1 = open('yourfile1.txt')
file1 = temp1.read().split(',')
temp1.close()
temp2 = open('yourfile2.txt')
file2 = temp2.read.split(',')
dict1 = {x : file1.count(x) for x in file1}
dict2 = {x : file2.count(x) for x in file2}
similars = set(file1).intersection(set(file2))
rate1 = sum(dict1[w] for w in similars)/len(file1)
rate2 = sum(dict2[w] for w in similars)/len(file2)
print("The rate of similarity is: ", rate1*rate2*100, '%')
print("The similar words are: ", similars)

当然，yourfile1.txt和yourfile2.txt是文件名。你知道吗

编程相关推荐

使用java在mysql中使用外键插入到表中
java Android按类别筛选列表
java对JGoodies外观的更改
java如何在Drools规则中推断中间值
用于虚拟拆分文本文件的java解决方案
使用XML的java Android UI（Android和XML）
使用ApachePOI库将工作表适配到xlsx文件中的单个页面时遇到的java问题
java类型为javafx。fxml。FXMLLoader不可访问（vscode）
java所有计划的作业都在运行，即使提到了节点id
java将大整数打印到文本文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

计算两者之间的相似性txt文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >