映射2个数据帧并替换目标数据帧中匹配值的标头

2024-05-20 10:09:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据帧:df1

  SAP_Name  SAP_Class  SAP_Sec
  Avi       5          C 
  Rison     6          A 
  Slesh     7          B 
  San       8          C 
  Sud       7          B 

df2型:

Name_Fi Class

Avi     5 
Rison   6 
Slesh   7 

我正在尝试将df2与df1匹配,以便匹配的值应该与df1一样替换头。你知道吗

SAP_Name  SAP_Class
 Ankan          5
 Rison          6
 Slesh          7

下面是我使用的代码:

d = {}
for col2 in df2.columns:
    for col1 in df1.columns:
        cond = df2[col2].isin(df1[col1]).all()
        if cond:
           d[col2] = col1
df2 = df2.rename(columns=d)
print (df2)

我能够在一个小文件中获得所需的输出,但是我的实际文件有112444行×446列,要更改的目标文件有3行×35列,在这种情况下代码运行了很长时间。有人能帮我吗?你知道吗


Tags: columns文件nameinforclasscol2col1
2条回答

我会重命名这些列并使用merge。你知道吗

cols = ['SAP_Name', 'SAP_Class']
df2.set_axis(cols, axis=1, inplace=False).merge(df1[cols])

  SAP_Name  SAP_Class
0      Avi          5
1    Rison          6
2    Slesh          7

在我看来,如果性能很重要,请将issubsetset一起使用:

d = {}
for col2 in df2.columns:
    for col1 in df1.columns:
        cond = set(df2[col2]).issubset(df1[col1])
        if cond:
           d[col2] = col1
df2 = df2.rename(columns=d)
print (df2)
  SAP_Name  SAP_Class
0      Avi          5
1    Rison          6
2    Slesh          7

编辑:

#create dictioanry of Series without dupes
dfs1 = {col1: df1[col1].drop_duplicates() for col1 in df1.columns}
#print (dfs1)

#create dictionary of sets
set2 = {col2: set(df2[col2]) for col2 in df2.columns}
#print (set2)

#loop buy both dictionaries and find columns for rename
d = {}
for col2, v2 in set2.items():
    for col1, v1 in dfs1.items():
        cond = v2.issubset(v1)
        if cond:
           d[col2] = col1
df2 = df2.rename(columns=d)
print (df2)
  SAP_Name  SAP_Class
0      Avi          5
1    Rison          6
2    Slesh          7

相关问题 更多 >