我需要在已经开发的模糊匹配条件下,将目标数据帧中的一行合并到源数据帧中,让我们调用方法fuzzyTest
。如果fuzzy test返回True
,我希望在匹配时将目标文件中的行合并到源文件中
所以基本上做一个左连接,当与SOURCE COMPANY.
比较时,TARGET COMPANY
通过fuzzyTest
源数据帧
SOURCE COMPANY
0 Cool Company
1 BigPharma
2 Tod Kompany
3 Wallmart
目标数据帧
TARGET COMPANY
0 Kool Company
1 Big farma
2 Todd's Company
3 C-Mart
4 SuperMart
5 SmallStore
6 ShopRus
希望通过fuzzyTest
映射后,输出将是:
SOURCE COMPANY TARGET COMPANY
0 Cool Company Kool Company
1 BigPharma Big farma
2 Tod Kompany Todd's Company
3 Wallmart NaN
因此,如果您的模糊逻辑只比较每行上的两个字符串,只需将其包装为一个函数,该函数接受列source和列target。 在一个数据帧中生成两列,然后运行:
相关问题 更多 >
编程相关推荐