连接具有相似但不精确值的列上的数据帧

select el*, coalesce(h.name, hv.name, hb.name) as name from employee_logs el left join hr_data h on el.employee_id = h.employee_id left join hr_data hv on el.employee_id = concat(h.employee_id, 'v') left join hr_data hb on el.employee_id = concat(h.employee_id, 'b');

1条回答

网友

1楼 · 发布于 2024-10-02 00:43:20

您可以使用正则表达式从Employee_Logs_df中的employee_id中去掉尾随字母，然后将其映射到HR_Data_df中的姓名：

new_df = Employee_Logs_df.assign(name = Employee_Logs_df.employee_id
                                 .str.extract('(.*\d+)',expand=False)
                                 .map(HR_Data_df.set_index('employee_id')['name']))

>>> new_df
  employee_id  action   name
0    2325255b   login    Rob
1    51666164   login    Tom
2   51666164v   login    Tom
3       r1211  logoff  Tammy
4   r18552421   login    Ron

如果需要，可以通过合并执行类似的操作：

new_df = Employee_Logs_df.merge(HR_Data_df.set_index('employee_id'),
                                left_on=Employee_Logs_df.employee_id
                                .str.extract('(.*\d+)',expand=False),
                                right_index=True)

>>> new_df
  employee_id  action   name
0    2325255b   login    Rob
1    51666164   login    Tom
2   51666164v   login    Tom
3       r1211  logoff  Tammy
4   r18552421   login    Ron

相关问题更多 >

编程相关推荐

热门问题

热门文章

连接具有相似但不精确值的列上的数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >