基于标签在同一数据帧中查找值并添加到新列（Vlookup）

Labels = ['A1-1', 'A1-2', 'A1-3', 'A1-4','B1-2', 'B1-3', 'B1-4', 'B1-5', 'Blank1', 'Blank2', 'Blank3'] Values = [8356532 ,7616084,5272477, 5076012, 411851, 415258, 8285777, 9700884, 9192185, 4466890,830516] Duplicate_of = ['','','','','','','','','A1-1', 'A1-4', 'B1-3'] d = {'Labels': Labels, 'Values': Values, 'Duplicate_of' : Duplicate_of} df = pd.DataFrame(data=d) df = df[['Labels','Values','Duplicate_of']]

2条回答

网友

1楼 · 编辑于 2024-09-27 21:25:20

不是一个节省内存的答案，但这是有效的

import numpy as np
dictionary = dict(zip(Labels, Values))
df["Original_value"] = df["Duplicate_of"].map(lambda x: np.nan if x not in dictionary else dictionary[x])

对于原始值中的其余值，它给出NaN。你可以决定用什么代替它。在

新列的类型不是整数，如果需要，也可以更改它。在

有了@jezrael评论，同样的事情可以做

^{pr2}$

网友

2楼 · 编辑于 2024-09-27 21:25:20

以下是最简单的方法，用一行代码：

df["Original_value"] = df["Duplicate_of"].apply(lambda x: "" if x == "" else df.loc[df["Labels"] == x, "Values"].values[0])

说明：

这只是对列"Duplicate_of"的每个元素应用lambda函数

首先检查项是否为空字符串，如果是，则返回空字符串：

^{pr2}$

相当于：

if x == "" return ""

如果不是空字符串，则执行以下命令：

df.loc[df["Labels"] == x, "Values"].values[0]

当条件df["Labels"] == x为真时，这个简单方法返回"Values"列中的值。如果您想知道.values[0]部分，它就在那里，因为.loc返回一个序列；在本例中，我们的序列只是一个值，所以我们只需使用.values[0]来获得它。在

相关问题更多 >

编程相关推荐

热门问题

热门文章