我有一个CSV文件,格式大致如下:
Day | Asset Allocation
0 | NYSE:100+++FTSE100:143+++DAX30:94
1 | NYSE:103+++FTSE97:143+++DAX30:95
2 | NYSE:102+++DAX30:97
3 | NYSE:102+++DAX30:97+++STOXX:102
因此,所有资产汇总在一列中,并用“++”分隔。列中资产的顺序可以随着CSV文件的进程而更改。我想将数据重新排列为以下格式:
Day | NYSE | FTSE | DAX | STOXX
0 | 100 | 143 | 94 | 0
1 | 103 | 143 | 95 | 0
2 | 102 | 0 | 97 | 0
3 | 102 | 0 | 97 | 102
最好是,我希望能够用Python来做这件事,因为我确实有一些以前的经验,也许能够更快地找到自己的方法。然而,由于最终的数据集可能包含数百万行,我当然愿意采用任何其他能够更有效地处理数据的方法
如果有人能给我指出正确的方向,我将不胜感激。谢谢
您可以使用
pandas
高效地完成这项工作本例使用
str.split
和regex应用必要的格式相关问题 更多 >
编程相关推荐