我有一个清单如下
A = ['vikash','vikas','Vinod',Vikky','Akash','Vinodh','Sachin','Salman,'Ajay','Suchin','Akash','vikahs']
我想将列表中的每个元素与每个元素进行匹配,并找到匹配率为90%或以上的每个元素的模糊匹配字符串以及匹配元素的计数
在数据框中,我的结果应该如下所示
string Matching strings count
===============================
Vikash vikas,vikahs 2
vikas vikash,vikahs 2
vinod vinodh 1
Vikky 0
Akash Akash 1
...
..
Vikahs vikash,vikas 2
有谁能帮助我实现这一点,因为我是python新手
谢谢
这可以通过以下方式使用fuzzyfuzzy实现:
作为替代方案,我编写了库^{} ,它在返回与fuzzyfuzzy相同的结果时速度更快,并且可以通过以下方式实现:
我确实运行了一个快速基准测试,以显示每1000次运行中两次之间的运行时差异:
两者的输出为:
相关问题 更多 >
编程相关推荐