我正在尝试创建一个字典来附加我的结果,并使用jaro distance函数获得最佳匹配。在
这是我尝试匹配两个列表并在两个列表中找到最匹配的名称的一部分。在
示例:
import jellyfish
jellyfish.jaro_distance(u'jellyfish', u'sellyfish')
output:
0.9259259259259259
我想做的是:
^{pr2}$在本例中,我希望它返回得分最高的2:
jellyfish jellyfihs 0.962962962963
salmonfish salmonfish 1.0
对于fuzzyfuzzy用户,我试图模拟process.extractOne
函数,在这个函数中,您可以将一个列表传递到process.extractOne(<value you want to compare>,<list of items you want to compare>)
中,您将得到最佳匹配。在
我之所以不使用fuzzyfuzzy只是因为处理速度太慢,而且我不确定后面发生了什么,5000个字符串与另一个5000个字符串列表的匹配需要40分钟。在
这可能会解决您的问题:
相关问题 更多 >
编程相关推荐