我有熊猫数据帧。在这个数据框中,我想修改一些行的几列。这些都是我尝试过的方法。在
df[['finalA', 'finalB']] = df[['A', 'B']]
exceptions = df.loc[df.normal == False]
就像一个咒语,但现在我想设置例外:
^{pr2}$这不管用。所以我试着从this answer使用.ix
。在
df.ix[exceptions.index, ['finalA', 'finalB']] = \
df.ix[exceptions.index, ['A_except', 'B_except']]
这也不管用。对于异常行,这两种方法都在finalA
和{NaN
。在
唯一可行的方法就是一次只写一个专栏:
df.ix[exceptions.index, 'finalA'] = \
df.ix[exceptions.index, 'A_except']
df.ix[exceptions.index, 'finalB'] = \
df.ix[exceptions.index, 'B_except']
熊猫这里怎么了?如何避免为显然是通过选择多个列生成的副本设置值?有没有办法避免这种代码重复?在
还有一些思考:它实际上并没有将值设置为dataframe的副本,而是将值设置为NaN。它实际上会将它们重写为一个新值。在
import pandas as pd
df = pd.DataFrame({'A': [1,2,3,4],
'B': [5,6,7,8],
'normal': [True, True, False, False],
'A_except': [0,0,9,9],
'B_except': [0,0,10,10]})
结果:
A A_except B B_except normal finalA finalB
0 1 0 5 0 True 1.0 5.0
1 2 0 6 0 True 2.0 6.0
2 3 9 7 10 False NaN NaN
3 4 9 8 10 False NaN NaN
预期结果:
A A_except B B_except normal finalA finalB
0 1 0 5 0 True 1 5
1 2 0 6 0 True 2 6
2 3 9 7 10 False 9 10
3 4 9 8 10 False 9 10
可以重命名“对齐”的列名:
另一种解决方案是将输出转换为
^{pr2}$numpy array
,但列不对齐:如果您查看方程的两边,您会注意到列不同。Pandas考虑了列的标签,因为它们不匹配,所以不会插入值。在
它只适用于一个列,因为这样就提取了一个序列,然后列标签就不再适用了。在
一个快速的解决方案是简单地将数据帧剥离到一个裸数组中,然后}方法都可以工作:
loc
和{但请记住,这样做将消除Pandas试图匹配列和索引标签的尝试,这基本上是一个“硬”插入。因此,作为一个用户,您需要负责正确的对齐。在这种情况下,这不是一个问题,而是一些需要注意的问题。在
相关问题 更多 >
编程相关推荐