pandas dataframe:将2列（值，值）转换为2列（值，类型）

utilization utilization_billable service 1 10.0 5.0 2 30.0 20.0 3 40.0 30.0 4 40.0 32.0

utilization type service 1 10.0 total 2 30.0 total 3 40.0 total 4 40.0 total 1 5.0 billable 2 20.0 billable 3 30.0 billable 4 32.0 billable

data = { 'utilization': [10.0, 30.0, 40.0, 40.0], 'utilization_billable': [5.0, 20.0, 30.0, 32.0], 'service': [1, 2, 3, 4] } df = pd.DataFrame.from_dict(data).set_index('service') print(df) data = { 'utilization': [10.0, 30.0, 40.0, 40.0, 5.0, 20.0, 30.0, 32.0], 'service': [1, 2, 3, 4, 1, 2, 3, 4], 'type': [ 'total', 'total', 'total', 'total', 'billable', 'billable', 'billable', 'billable', ] } df = pd.DataFrame.from_dict(data).set_index('service') print(df)

3条回答

网友

1楼 · 编辑于 2024-06-28 19:40:45

您可以使用^{}：

import pandas as pd
data = {
    'utilization': [10.0, 30.0, 40.0, 40.0],
    'utilization_billable': [5.0, 20.0, 30.0, 32.0],
    'service': [1, 2, 3, 4]}

df = pd.DataFrame(data)
result =  pd.melt(df, var_name='type', value_name='utilization', id_vars='service')
print(result)

收益率

   service                  type  utilization
0        1           utilization         10.0
1        2           utilization         30.0
2        3           utilization         40.0
3        4           utilization         40.0
4        1  utilization_billable          5.0
5        2  utilization_billable         20.0
6        3  utilization_billable         30.0
7        4  utilization_billable         32.0

然后result.set_index('service')将service作为索引，但我建议避免这样做，因为service值不是唯一的。你知道吗

网友

2楼 · 编辑于 2024-06-28 19:40:45

看起来像是df.stack()的作业，有多个DataFrame.rename()

df.rename(index=str, columns={"utilization": "total", "utilization_billable": "billable"})\
  .stack().reset_index(1).rename(index=str, columns={"level_1": "type", 0: "utilization"})\
  .sort_values(by='type', ascending = False)

输出：

             type  utilization
service                       
1           total         10.0
2           total         30.0
3           total         40.0
4           total         40.0
1        billable          5.0
2        billable         20.0
3        billable         30.0
4        billable         32.0

网友

3楼 · 编辑于 2024-06-28 19:40:45

这可以通过在第一列添加后缀后使用pd.wide_to_long来完成。你知道吗

import pandas as pd
df = df.rename(columns={'utilization': 'utilization_total'})

pd.wide_to_long(df.reset_index(), stubnames='utilization', sep='_', 
                i='service', j='type', suffix='.*').reset_index(1)

输出：

             type  utilization
service                       
1           total         10.0
2           total         30.0
3           total         40.0
4           total         40.0
1        billable          5.0
2        billable         20.0
3        billable         30.0
4        billable         32.0

有没有一种方法可以转换数据帧并执行这种分类？

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章