如何使用pandas将两列数据合并为一列并加上“+”号

Drug Product(Predicted) #N/A acetaldehyde #N/A nicotine #N/A resin #N/A rosa #N/A eliglustat #N/A valpromide #N/A clostridium #N/A ambenonium solution valpromide solution valpromide solution valpromide solution valpromide solution valpromide solution valpromide solution valpromide solution valpromide solution valpromide #N/A amiloride #N/A valsartÃ¡n #N/A manitol #N/A hipromelosa #N/A fosfato disÃ³dico #N/A fosfato disÃ³dico #N/A agalsidase beta #N/A enoxaparin sodium solution warfarine #N/A eliglustat #N/A silver #N/A silver

2条回答

网友

1楼 · 编辑于 2024-09-29 20:16:00

如果您的数据帧中没有null值（称为null），那么我建议您执行以下操作：

df["drug"].replace("#N/A", np.nan, inplace = True)

一旦将缺少的值替换为null，答案就只有一行代码了

df["new_col"] = df["drug"] + " + " + df["Product"]

如果列、产品或药物中的任何一个为null，则上述代码将返回null的输出

希望这有帮助

网友

2楼 · 编辑于 2024-09-29 20:16:00

将^{}与^{}一起使用：

df['new'] = df['Drug'].str.cat(df['Product(Predicted)'], na_rep='', sep='+').str.strip('+')

或在合并前将缺少的值替换为空字符串：

df['new'] = (df['Drug'].fillna('') + '+' + df['Product(Predicted)']).str.strip('+')

print (df)
       Drug Product(Predicted)                  new
0       NaN       acetaldehyde         acetaldehyde
1       NaN           nicotine             nicotine
2       NaN              resin                resin
3       NaN               rosa                 rosa
4       NaN         eliglustat           eliglustat
5       NaN         valpromide           valpromide
6       NaN        clostridium          clostridium
7       NaN         ambenonium           ambenonium
8  solution         valpromide  solution+valpromide
9  solution         valpromide  solution+valpromide

如果要删除drug列中带有NaN的行：

df1 = df.dropna(subset=['Drug'])
df1['new'] = df1['Drug'] + '+' + df1['Product(Predicted)']
print (df)
       Drug Product(Predicted)                  new
8  solution         valpromide  solution+valpromide
9  solution         valpromide  solution+valpromide

相关问题更多 >

编程相关推荐

热门问题

热门文章