如何基于pandas和python中所有可能的列组合组合组合两个csv文件

2024-10-06 08:09:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个包含多列的csv文件。这里,为了简单起见,我只显示了三列和三行。下面给出了文件,点“…”表示额外的列和行

               FileA:                                FileB:
       Text,     a,   b, ....                 Text,     c,   d, ....
    any text,   1,   0, ....               any text,   1,   0, ....
    any text,   0,   1, ....               any text,   0,   1, ....
    any text,   1,   1, ....               any text,   0,   0, ....
    ..........                             ...........

我需要两个文件中所有可能的列组合作为单独的数据帧,在每个组合(2列)的末尾添加一个新列,其中包含每行值的总和

两个文件中总共有4列(文本列在每个组合中只出现一次),所有组合将有三个新文件,总共有5列(文本作为索引列),但我需要它用于所有列和行,而不仅仅是四列,如图所示。对于生成的文件,将是:

                        dataframeA:                             
    Text,     a,   b, ...., sum,   c,   d, ..., sum
  any text,   1,   0, ....,  1,    1,   0, ...,  1
  any text,   0,   1, ....,  1,    0,   1, ...,  1
  any text,   1,   1, ....,  2,    0,   0, ...,  0
  ................

                        dataframeB:                                                  
    Text,     a,    c,..., sum,    b,   d, ..., sum     
  any text,   1,    1,...,  2,     0,   0, ...,  0   
  any text,   0,    0,...,  0,     1,   1, ...,  2   
  any text,   1,    0,...,  1,     1,   0, ...,  1   
  .................
              
                       dataframeC:                                                 
    Text,     a,   d,..., sum,    b,   c, ..., sum  
  any text,   0,   0,...,  0,     0,   1, ...,  1   
  any text,   1,   1,...,  2,     1,   0, ...,  1   
  any text,   1,   0,...,  1 ,    1,   0, ...,  1  
  ..................              
                                 
              

这些组合对我来说有点复杂。如果有人能帮助我,我将不胜感激

谢谢


Tags: 文件csv数据text文本anysum末尾