如果两列中的值为sam,则合并两列中的单元格

2024-10-02 22:29:13 发布

您现在位置:Python中文网/ 问答频道 /正文

在dataframe方面,我有以下数据

data = pd.DataFrame({'colA': ['a', 'c', 'a', 'e', 'c', 'c'], 'colB': ['b', 'd', 'b', 'f', 'd', 'd'], 'colC':['SD100', 'SD200', 'SD300', 'SD400', 'SD500', 'SD600']})

我要附件的输出 [在此处输入图像描述][2]

我想用python中的dataframe来实现这一点 有人能帮我吗?你知道吗


Tags: 数据dataframedata附件pdcolccolbcola
3条回答

这将更新您的数据到您想要的

data=data.groupby(['colA','colB']).agg(list)

我不知道为什么要创建multindex,但是您可以简单地sort_values或使用groupby。你知道吗

import pandas as pd
df = pd.DataFrame({"ColumnA":['a','c','a','e','c','c'],
                 "ColumnB":['b','d','b','f','d','d'],
                 "ColumnC":['SD100','SD200','SD300','SD400','SD500','SD600']})
print(df)
      ColumnA ColumnB ColumnC
    0       a       b   SD100
    1       c       d   SD200
    2       a       b   SD300
    3       e       f   SD400
    4       c       d   SD500
    5       c       d   SD600
df = df.sort_values(by=['ColumnA','ColumnB'])
df.set_index(['ColumnA', 'ColumnB','ColumnC'], inplace=True)
df

您可以尝试:

  Column A Column B Column C
0        a        b    SD100
1        c        d    SD200
2        a        b    SD300
3        e        f    SD400
4        c        d    SD500
5        c        d    SD600

>>> df.groupby(['Column A', 'Column B']).agg(list)
                                Column C
Column A Column B
a        b                [SD100, SD300]
c        d         [SD200, SD500, SD600]
e        f                       [SD400]

相关问题 更多 >