模糊匹配2数据帧？

2024-10-06 13:05:31 发布

您现在位置：Python中文网/ 问答频道 /正文

3338

网友

男 | 程序猿一只，喜欢编程写python代码。

有一个名为fuzzy_pandas的包，可以使用levenshtein进行比率字符串匹配。有一些很好的例子here

例如：

import pandas as pd
import fuzzy_pandas as fpd

df1 = pd.DataFrame({'Key':['Apple', 'Banana', 'Orange', 'Strawberry']})
df2 = pd.DataFrame({'Key':['Aple', 'Mango', 'Orag', 'Straw', 'Bannanna', 'Berry']})

results = fpd.fuzzy_merge(df1, df2,
            left_on='Key',
            right_on='Key',
            method='levenshtein',
            threshold=0.6)

results.head()

所以，我不知道是否有可能在结果中显示阈值

输出为：

Key Key
0   Apple   Aple
1   Banana  Bannanna
2   Orange  Orag

我想要像这样的东西：

Key Key Ratio
0   Apple   Aple 0.81
1   Banana  Bannanna 0.87
2   Orange  Orag 0.78

Maybe with another library

Tags： key import apple pandas as fuzzy levenshtein pd

0条回答

目前没有回答

模糊匹配2数据帧？

相关问题更多 >

编程相关推荐

热门问题

热门文章

模糊匹配2数据帧？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >