使用Pandas从包含于另一个dataframe中的值检测dataframe的索引

nan_names = df1['Name'][df1['Id'].isnull()] df3 = pd.DataFrame() for name in nan_names: index = df2[df2['XXX']==name].index.tolist() if index: dic = {'name':[name] , 'index':[index]} df3 = pd.concat([df3,pd.DataFrame(dic)], ignore_index=True)

2条回答

网友

1楼 · 编辑于 2024-06-13 11:55:14

我想你可以用^{}和^{}和applylist：

nan_names = df1.loc[df1['Id'].isnull(), ['Name']]
print (nan_names)
   Name
2  TNCO
5  FIGO
7  LABO

df = pd.merge(df2.reset_index(), nan_names, on='Name', suffixes=('','_'))
print (df)
   index  Name
0      5  FIGO
1      6  FIGO
2     11  TNCO
3     12  TNCO
4     13  TNCO

print (df.groupby('Name')['index'].apply(list).reset_index())
   Name         index
0  FIGO        [5, 6]
1  TNCO  [11, 12, 13]

网友

2楼 · 编辑于 2024-06-13 11:55:14

您正在寻找方法isin：

df = df2[df2['XXX'].isin(nan_names)]

这将返回：

    XXX
5   FIGO
6   FIGO
11  TNCO
12  TNCO
13  TNCO

从这里开始，只需要格式化：

df.reset_index().groupby('XXX')['index'].apply(list)

这将返回：

XXX
FIGO          [5, 6]
TNCO    [11, 12, 13]

其思想是重置索引，使其成为一列（名为index）。按名称分组并应用list函数将返回每个名称的原始索引列表。你知道吗

再次调用reset_index将返回您要查找的结果。你知道吗

编辑

将所有内容组合成一行，这将是输出：

In [21]: df2[df2['XXX'].isin(nan_names)].reset_index().groupby('XXX')['index'].apply(list).reset_index()
Out[21]: 
   XXX         index
0  FIGO        [5, 6]
1  TNCO  [11, 12, 13]

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Pandas从包含于另一个dataframe中的值检测dataframe的索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >