我正在处理两个数据帧:
df1 = {'Metropolitan area': {0: 'New York City',
1: 'Los Angeles',
2: 'San Francisco Bay Area',
3: 'Chicago',
4: 'Dallas–Fort Worth'},
'token_nhl': {0: 'Devils',
1: 'Ducks',
2: 'Sharks',
3: 'Blackhawks',
4: 'Stars'}}
df2 = {'NHL': {0: 'team1', 1: 'team2', 2: 'team3', 3: 'team4', 4: 'team5'},
'token_nhl': {0: 'Devils', 1: 'Ducks', 2: 'x', 3: 'Stars', 4: 'Sharks'},
'token_nhl1': {0: 'a', 1: 'b', 2: 'Blackhawks', 3: 'c', 4: 'd'}}
我正在尝试合并它们,但我希望将df1中“token\u nhl”列的值与df2中的“token\u nhl”和“token\u nhl1”匹配,因此每当我在“token\u nhl”中找不到值时,我都会在“token\u nhl1”中查找它,然后生成的数据帧将是:
{'NHL': {0: 'team1', 1: 'team2', 2: 'team3', 3: 'team4', 4: 'team5'},
'token_nhl_left': {0: 'Devils', 1: 'Ducks', 2: 'x', 3: 'Stars', 4: 'Sharks'},
'token_nhl1_left': {0: 'a', 1: 'b', 2: 'Blackhawks', 3: 'c', 4: 'd'},
'token_nhl_right': {0: 'Devils',1: 'Ducks',2: 'Blackhawks',3: 'Stars',4: 'Sharks'}}
为此,您需要合并两次:
1:重命名列,因为合并后熊猫没有给出两个不同的列
合并-1
合并-2
海螺
我处理这个问题的方法包括两个步骤
1-创建一段代码,将所需信息添加到列表中:
2-将该列表分配给包含所有其他所需数据的新数据框。之后,重命名列:
相关问题 更多 >
编程相关推荐