获取数据框列中正确值而不是NaN的标题

ltv = pd.DataFrame(data=np.zeros([actual_df.shape[0], 6]), columns=['customer_id', 'actual_total', 'predicted_num_purchases', 'predicted_value', 'predicted_total', 'error'], dtype=np.float32)

2条回答

网友

1楼 · 编辑于 2024-09-27 07:21:31

您需要在这两个数据帧中使用相同的索引值（以及两个数据帧的相同长度）

因此，第一个解决方案是在actual_df中创建默认RabgeIndex，在ltv中未指定，因此默认创建：

actual_df = actual_df.reset_index(drop=True)
ltv['customer_id'] = actual_df['customer_id']

或将参数index添加到DataFrame构造函数：

ltv = pd.DataFrame(data=np.zeros([actual_df.shape[0], 6]),
                        columns=['customer_id',
                                'actual_total',
                                'predicted_num_purchases',
                                'predicted_value',
                                'predicted_total',
                                'error'], dtype=np.float32,
                        index=actual_df.index)

ltv['customer_id'] = actual_df['customer_id']

网友

2楼 · 编辑于 2024-09-27 07:21:31

另一种选择（比耶兹雷尔的伟大答案更复杂）是使用pd.concat()后跟.drop()：

ltv = pd.concat([ltv.drop(columns=['customer_id']),actual_df[['customer_id']]],axis=1,ignore_index=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章

获取数据框列中正确值而不是NaN的标题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >