连接具有分类特征的数据帧时的无序索引

Overview_Table = pd.DataFrame() for i, val in enumerate(df['Order'): dfi = df.loc[df['Order']==val] status = pd.DataFrame(dfi['Status Situation'].value_counts(normalize = True)) statusi.columns = ['Order: {}'.format(val)] Overview_Table = pd.concat([Overview_Table, statusi], axis=1)

1条回答

网友

1楼 · 发布于 2024-09-29 01:22:59

我想这就是你要找的

创建具有顺序和状态以及一些随机数的随机数据集：

import pandas as pd
import random
order = [random.choice(['aa', 'bb', 'cc']) for _ in range(1000)]
status = [random.choice(['red', 'yellow', 'green']) for _ in range(1000)]
nums = [random.randint(1, 10) for _ in range(1000)]

df = pd.DataFrame({'order':order,
                   'status':status,
                   'value':nums})

按顺序和状态分组并求和值：

g = df.groupby(['order', 'status']).agg({'value':'sum'}).reset_index(drop=False)

按顺序分组并求和（以获得分母）

order_g = df.groupby('order')['value'].sum().reset_index(drop=False)

通过左连接将它们合并：

combined = pd.merge(g, order_g, on='order', how='left')

创建百分比（值\u counts normalize）：

combined['percentage'] = combined['value_x']/combined['value_y']

删除不需要的列：

combined.drop(['value_x', 'value_y'], axis=1, inplace=True)

如果没有你提供的实际数据集，以及你所寻找的东西的期望，很难肯定地回答这个问题，但我相信这就是你所寻找的

相关问题更多 >

编程相关推荐

热门问题

热门文章

连接具有分类特征的数据帧时的无序索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >