pandas python中的VLOOKUP Excel模拟

网友

1楼 · 编辑于 2024-09-30 02:21:16

通常在Pandas中使用join（默认为左连接）或merge（其中必须指定how='left'）。在

在您的例子中，您尝试查找基于三列的值。一种方法是使用or获取第一个非空值。在

>>> (df1
     .assign(temp = [region or two_city or city 
                     for region, two_city, city in zip(df1.Region, df1['2City'], df1.City)])
     .merge(df2, how='left', right_on='City', left_on='temp', suffixes=['', '_'])
     .drop(['temp', 'City_'], axis=1))

   ID     City Region 2City Office
0  23   Moscow    Msk  None    Msk
1  34  Obninsk    Msk   Msk    Msk
2  56     None   None   Spb    Spb
3  17     Tula    Spb  None    Msk

网友

2楼 · 编辑于 2024-09-30 02:21:16

您可以用^{}合并这两个数据帧，但据我所知，您实际上希望在df1中的不同列上合并。一种可能的方法是添加一个额外的列，该列的值为'City'（如果可用）（否则是'region'或{}）。在

import pandas as pd

df1['Office'] = df1.City.fillna(df1.Region).fillna(df1['2City'])
df = pd.merge(df1, df2.reindex(columns='Office'), on='Office')

您不需要指定两个数据帧中是否缺少值。如果是这样，您可以使用how参数控制它们的处理pd.merge。在

网友

3楼 · 编辑于 2024-09-30 02:21:16

import pandas as pd
df1 = pd.DataFrame([[23, 'Moscow', 'Msk', ''],
                    [34, 'Obninsk', 'Msk', 'Msk'],
                    [56, '', '', 'Spb'],
                    [17, 'Tula', 'Spb', '']],
                   columns=['ID', 'City', 'Region', '2City'])
df2 = pd.DataFrame([['Msk', 'Msk'],
                    ['Spb', 'Spb'],
                    ['Tula', 'Msk'],
                    ['Moscow', 'Msk']],
                   columns=['City', 'Office'])

df = pd.concat([df1.loc[df1[x].isin(df2['City']), x] for x in ['City', 'Region', '2City']])
df1['Join'] = df.groupby(df.index).first()
output = df1.merge(df2, left_on='Join', right_on='City', how='right')

此时，名为“output”的pandas.DataFrame将包含一个名为“Office”的列，该列的索引与df1相匹配。你可以这样做：

^{pr2}$

这将为您提供所请求的数据帧以及附加列“Join”，您可以通过以下方式删除：

df1.drop('Join', axis=1, inplace=True)

这里的OP基本上想做三个单独的合并——在df1中的“City”、“Region”和“2City”列中的每一个合并。因此，在没有体操的情况下使用基本的pandas.DataFrame操作是不容易做到的。我只是在列表理解中隐藏了for循环，但它仍然存在。在

相关问题更多 >

编程相关推荐

热门问题

热门文章