合并两列不同的数据帧

ID word 1 srv1 2 srv2 , srv12 3 srv1 , srv10 4 srv8 5 srv3 , srv4 6 srv1 , srv7 7 srv5 8 srv9

ID word 1 nan 2 srv2 , srv12 3 srv1 , srv10 4 nan 5 srv3 , srv4 6 srv1 , srv7 7 nan 8 nan

3条回答

网友

1楼 · 编辑于 2024-09-28 20:53:57

您可以使用^{}来选择现有的值或串联的值。你知道吗

试试这个：

import pandas as pd
import numpy as np
from io import StringIO

df1 = pd.read_csv(StringIO("""
ID             word
1              srv1
2              srv2
3              srv1
4              nan
5              srv3
6              srv1
7              srv5
8              nan"""), sep=r"\s+")

df2 = pd.read_csv(StringIO("""
ID             word
1              nan
2              srv12
3              srv10
4              srv8
5              srv4
6              srv7
7              nan
8              srv9"""), sep=r"\s+")


conditions = [(~df1["word"].isna()) & df2["word"].isna(), df1["word"].isna() & (~df2["word"].isna()), (~df1["word"].isna()) & (~df2["word"].isna())]
choices = [df1["word"], df2["word"], df1["word"] + "," + df2["word"]]

df1["word"] = np.select(conditions,choices)

print(df1)

输出：

   ID        word
0   1        srv1
1   2  srv2,srv12
2   3  srv1,srv10
3   4        srv8
4   5   srv3,srv4
5   6   srv1,srv7
6   7        srv5
7   8        srv9

网友

2楼 · 编辑于 2024-09-28 20:53:57

您可以使用^{}和na_rep选项来填充word列，即使是nan中的一个源列，然后使用str.strip来修剪不在单词之间的任何前导/尾随' , '。你知道吗

m['word'] = m['word_x'].str.cat(m['word_y'], sep=' , ', na_rep='').str.strip(' , ')

退货

   ID word_x word_y          word
0   1   srv1    NaN          srv1
1   2   srv2  srv12  srv2 , srv12
2   3   srv1  srv10  srv1 , srv10
3   4    NaN   srv8          srv8
4   5   srv3   srv4   srv3 , srv4
5   6   srv1   srv7   srv1 , srv7
6   7   srv5    NaN          srv5
7   8    NaN   srv9          srv9

网友

3楼 · 编辑于 2024-09-28 20:53:57

基于我认为你想做的，我首先要去掉那些nan：

df_1.fillna(value="")
df_2.fillna(value="")

然后我会再次尝试合并，看看你是否得到你想要的。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

合并两列不同的数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >