根据条件,从目标文件连接行

2024-10-08 18:27:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在已经开发的模糊匹配条件下,将目标数据帧中的一行合并到源数据帧中,让我们调用方法fuzzyTest。如果fuzzy test返回True,我希望在匹配时将目标文件中的行合并到源文件中

所以基本上做一个左连接,当与SOURCE COMPANY.比较时,TARGET COMPANY通过fuzzyTest

源数据帧

          SOURCE COMPANY
0           Cool Company
1              BigPharma
2            Tod Kompany
3               Wallmart

目标数据帧

                       TARGET COMPANY
0                        Kool Company
1                           Big farma
2                      Todd's Company
3                              C-Mart
4                           SuperMart
5                          SmallStore
6                             ShopRus

希望通过fuzzyTest映射后,输出将是:

                       SOURCE COMPANY       TARGET COMPANY
0                        Cool Company         Kool Company
1                           BigPharma            Big farma
2                         Tod Kompany       Todd's Company
3                            Wallmart                  NaN     

Tags: 数据sourcetarget目标companybigcoolwallmart
1条回答
网友
1楼 · 发布于 2024-10-08 18:27:51

因此,如果您的模糊逻辑只比较每行上的两个字符串,只需将其包装为一个函数,该函数接受列source和列target。 在一个数据帧中生成两列,然后运行:

def FuzzyTest(source,target):
    .....
    if ...:
      return target
    else:
      return None

df['Target Company'] = df.apply(lambda x: FuzzyTest(x['Source'],x['Target'])

相关问题 更多 >

    热门问题