当我使用这种语法时,它会创建一个序列,而不是向我的新数据帧(sum)添加一个列。请帮忙。
我的代码:
sum = data['variance'] = data.budget + data.actual
我的数据(在dataframe df中):(当前除了预算-实际之外,还有其他所有东西,我想创建一个差异列吗?
cluster date budget actual | budget - actual
0 a 2014-01-01 00:00:00 11000 10000 1000
1 a 2014-02-01 00:00:00 1200 1000
2 a 2014-03-01 00:00:00 200 100
3 b 2014-04-01 00:00:00 200 300
4 b 2014-05-01 00:00:00 400 450
5 c 2014-06-01 00:00:00 700 1000
6 c 2014-07-01 00:00:00 1200 1000
7 c 2014-08-01 00:00:00 200 100
8 c 2014-09-01 00:00:00 200 300
同样的想法也可以用lambda函数来实现。 在这里,我从xlsx文件中读取数据。
输出:
把两列加在第三列。
输出:
我认为您误解了一些python语法,下面有两个任务:
所以在你的代码中好像你在做:
后者为df创建一个新列:
作为旁白,不应该使用
sum
作为变量名来重写内置的sum函数。您还可以使用^{} 函数:
相关问题 更多 >
编程相关推荐