在pandas中合并和减去DataFrame列?

2024-05-20 18:43:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框,类似于:

col1  col2 col3 col5
NaN    1    2    8
2     NaN   4    8
4     NaN   4    8

我想做两件事:

1)合并列1和列2:

newcol1 col3 col5
1       2    8
2       4    8
4       4    8

我试过使用.concat,但这只是连接行。似乎我不能用标准的+运算符来处理NaN值。

2)从新的第1列和第3列中减去第5列,得到:

newcol1    col3
-7         -6
-6         -4
-4         -4

试着这样做:

dataframe[['newcol1', 'col2']] - dataframe['col5']

以及

dataframe[['newcol1', 'col2']].subtract(dataframe['col5'])

但都不管用。


Tags: 数据dataframe标准运算符nan两件事col2col3
3条回答

这里有一种方法。

您可以通过sum(axis=1)创建newcol1

In [256]: df['newcol1'] = df[['col1', 'col2']].sum(axis=1)

In [257]: df
Out[257]:
   col1  col2  col3  col5  newcol1
0   NaN     1     2     8        1
1     2   NaN     4     8        2
2     4   NaN     4     8        4

然后在axis=0上使用df.sub()

In [258]: df[['newcol1', 'col3']].sub(df['col5'], axis=0)
Out[258]:
   newcol1  col3
0       -7    -6
1       -6    -4
2       -4    -4
In [58]:

df['newcol'] = df[['col1','col2']].sum(axis=1) - df['col5']
df['col3'] = df['col3'] - df['col5']
df
Out[58]:
   col1  col2  col3  col5  newcol
0   NaN     1    -6     8      -7
1     2   NaN    -4     8      -6
2     4   NaN    -4     8      -4

然后您可以放下col1和col2:

In [59]:

df = df.drop(['col1','col2'],axis=1)
df
Out[59]:
   col3  col5  newcol
0    -6     8      -7
1    -4     8      -6
2    -4     8      -4

要获取新列,可以使用fillna(或combine_first):

df['newcol1'] = df.col1.fillna(df.col2)

然后对于减法,使用sub并指定axis=0,因为我们希望在匹配标签时考虑行索引(而不是默认的列索引):

>>> df[['newcol1', 'col3']].sub(df['col5'], axis=0)
   newcol1  col3
0       -7    -6
1       -6    -4
2       -4    -4

相关问题 更多 >