Pandas如何将一组3的列旋转到行中

2024-09-30 22:15:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个需要变换和旋转的df。每个季节有3个相关列(开始、结束和速率)。我正在寻找轴心这些列,在最后只有3列开始,结束和速度 enter image description here

df:

ID S1start  S1end  Rate  S2start  S2end   Rate  S3start  S3end  Rate  S4start  S4end  Rate
1  1/1/21  1/31/21  80   2/1/21  2/28/21   85   3/1/21  3/31/21  90   4/1/21  4/30/21  95

最终:

 ID  Start     End   Rate
  1  1/1/21  1/31/21  80
  1  2/1/21  2/28/21  85
  1  3/1/21  3/31/21  90
  1  4/1/21  4/30/21  95

Tags: iddfrate速率速度季节轴心s4end
3条回答

您可以从pyjanitor使用pivot_longer函数;目前,您必须从github安装最新的开发版本:

您共享的数据具有模式(一些列以start结尾,其他列以end结尾,一些以Rate开头),我们可以使用这些模式来重塑数据

# install latest dev version
# pip install git+https://github.com/ericmjl/pyjanitor.git
 import janitor
df.pivot_longer(
    index="ID",
    names_pattern=("start$", "end$", "^Rate"),
    names_to=("Start", "End", "Rate"),
)

   ID   Start    End    Rate
0   1   1/1/21  1/31/21 80
1   1   2/1/21  2/28/21 85
2   1   3/1/21  3/31/21 90
3   1   4/1/21  4/30/21 95

names_to采用新名称,而names_pattern采用模式,并相应地重塑数据

如果格式前缀为reshape,请尝试使用该格式

out = pd.DataFrame(df.values.reshape((-1,3)), columns=['start','end','rate'])
Out[419]: 
    start      end rate
0  1/1/21  1/31/21   80
1  2/1/21  2/28/21   85
2  3/1/21  3/31/21   90
3  4/1/21  4/30/21   95

您可以将df.filterpd.concat一起使用:

In [589]: start = df.stack().filter(like='start').reset_index()[0]    
In [590]: end = df.stack().filter(like='end').reset_index()[0]
In [591]: rate = df.stack().filter(like='Rate').reset_index()[0]

In [594]: x = pd.concat([start.rename('Start'), end.rename('End'), rate.rename('Rate')], 1)

假设您有2个静态列:ID, PropCode。您可以像这样将这些col附加到x

In [640]: x[['ID', 'PropCode']] = df[['ID', 'PropCode']].values.tolist() * len(x)

In [641]: x
Out[641]: 
    Start      End Rate  ID  PropCode
0  1/1/21  1/31/21   80   1     52032
1  2/1/21  2/28/21   85   1     52032
2  3/1/21  3/31/21   90   1     52032
3  4/1/21  4/30/21   95   1     52032

相关问题 更多 >