堆栈/取消堆栈在python中不保留数据顺序

[[{"value":"ZZ","formattedValue":"ZZ"},{"value":"In","formattedValue":"In"},{"value":"Amount1","formattedValue":"Amount1"},{"value":"100","formattedValue":"100"}],[{"value":"ZZ","formattedValue":"ZZ"},{"value":"In","formattedValue":"In"},{"value":"Amount2","formattedValue":"Amount2"},{"value":"200","formattedValue":"200"}],[{"value":"ZZ","formattedValue":"ZZ"},{"value":"Out","formattedValue":"Out"},{"value":"Amount1","formattedValue":"Amount1"},{"value":"30","formattedValue":"30"}],[{"value":"ZZ","formattedValue":"ZZ"},{"value":"Out","formattedValue":"Out"},{"value":"Amount2","formattedValue":"Amount2"},{"value":"4","formattedValue":"40"}],[{"value":"CC","formattedValue":"CC"},{"value":"In","formattedValue":"In"},{"value":"Amount1","formattedValue":"Amount1"},{"value":"100","formattedValue":"100"}],[{"value":"CC","formattedValue":"CC"},{"value":"In","formattedValue":"In"},{"value":"Amount2","formattedValue":"Amount2"},{"value":"200","formattedValue":"200"}],[{"value":"CC","formattedValue":"CC"},{"value":"Out","formattedValue":"Out"},{"value":"Amount1","formattedValue":"Amount1"},{"value":"30","formattedValue":"30"}],[{"value":"CC","formattedValue":"CC"},{"value":"Out","formattedValue":"Out"},{"value":"Amount2","formattedValue":"Amount2"},{"value":"4","formattedValue":"40"}]]

data = 'jsondata' data = json.loads(data) df = pd.DataFrame(data).stack().map(lambda x:x.get('formattedValue')).unstack() df.columns =['Type','InOut','MeasureName','MeasureValue'] df = df.pivot_table(index=['Type','InOut'],columns=['MeasureName'],values="MeasureValue",aggfunc='sum').reset_index()

3条回答

网友

1楼 · 编辑于 2024-10-04 01:34:39

还有另一种解决方案：在将数据放入pandas之前清理数据：

data = json.loads(s)
data = list(map(lambda row: [el.get('formattedValue') for el in row], data))
df = pd.DataFrame(data, columns=['Dimension', 'Type', 'Amount1', 'Amount2'])

网友

2楼 · 编辑于 2024-10-04 01:34:39

另一个解决方案：

df = pd.DataFrame(
    [
        {
            "Dimension": subl1[0]["formattedValue"],
            "Type": subl1[1]["formattedValue"],
            "Amount1": subl1[-1]["formattedValue"],
            "Amount2": subl2[-1]["formattedValue"],
        }
        for subl1, subl2 in zip(data[::2], data[1::2])
    ]
)
print(df)

印刷品：

  Dimension Type Amount1 Amount2
0        ZZ   In     100     200
1        ZZ  Out      30      40
2        CC   In     100     200
3        CC  Out      30      40

网友

3楼 · 编辑于 2024-10-04 01:34:39

IIUC：

您可以尝试：

在pivot_表创建变量之前：

uni=df['Type'].unique()

旋转后使用：

df=df.loc[df['Type'].map(dict(zip(uni,range(len(uni))))).sort_values().index]

df的输出：

MeasureName     Type        InOut
  2             ZZ              In
  3             ZZ              Out
  0             CC              In
  1             CC              Out

相关问题更多 >

编程相关推荐

热门问题

热门文章