如何基于其他数据帧在数据帧中创建连接？

+-------+-------+-------+----+----+----+ | Stud1 | Stud2 | Stud3 | 90 | 80 | 95 | | Stud2 | Stud4 | Stud1 | 80 | 55 | 90 | | Stud1 | Stud3 | Stud4 | 90 | 95 | 55 | +-------+-------+-------+----+----+----+

2条回答

网友

1楼 · 编辑于 2024-06-28 19:32:25

如果df3中的所有值都存在于Name列中，则解决方案的工作原理相同：

s = dfnamepoints.set_index('Name')['Point']
df = df3.join(df3.replace(s).add_prefix('new_'))

或：

df = df3.join(df3.apply(lambda x: x.map(s)).add_prefix('new_'))

或：

df = df3.join(df3.applymap(s.get).add_prefix('new_'))

print (df)
      s1     s2     s3  new_s1  new_s2  new_s3
0  Stud1  Stud2  Stud3      90      80      95
1  Stud2  Stud4  Stud1      80      55      90
2  Stud1  Stud3  Stud4      90      95      55

如果不存在，则输出不同-对于不存在的值（Stud1）获取NaNs：

print (dfnamepoints)
    Name  Point Category
0  Stud2     80  Average
1  Stud3     95     Good
2  Stud4     55     Poor

df = df3.join(df3.applymap(s.get).add_prefix('new_'))
#or 
df = df3.join(df3.applymap(s.get).add_prefix('new_'))

print (df)
      s1     s2     s3  new_s1  new_s2  new_s3
0  Stud1  Stud2  Stud3     NaN      80    95.0
1  Stud2  Stud4  Stud1    80.0      55     NaN
2  Stud1  Stud3  Stud4     NaN      95    55.0

对于replace获取原始值：

df = df3.join(df3.replace(s).add_prefix('new_'))
print (df)
      s1     s2     s3 new_s1  new_s2 new_s3
0  Stud1  Stud2  Stud3  Stud1      80     95
1  Stud2  Stud4  Stud1     80      55  Stud1
2  Stud1  Stud3  Stud4  Stud1      95     55

网友

2楼 · 编辑于 2024-06-28 19:32:25

或者，在创建df2的2个相关列的字典之后，可以使用df.replace()：

pd.concat([df1,df1.replace(dict(zip(df2.Name,df2.Point))).add_prefix('new_')],axis=1)

输出：

      s1     s2     s3  new_s1  new_s2  new_s3
0  Stud1  Stud2  Stud3      90      80      95
1  Stud2  Stud4  Stud1      80      55      90
2  Stud1  Stud3  Stud4      90      95      55

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何基于其他数据帧在数据帧中创建连接？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >