从包含多个键的字典列表创建pandas timeseries

timestamp1=1; value1=5; timestamp2=2; value2=8; timestamp3=3; value3=4; timestamp4=4; value4=12; resultsOfAlgorithms=[ { 'algorithm':'minmax', 'param-a':'12', 'param-b':'200', 'result-of-algorithm':[[timestamp1,value1],[timestamp2,value2]] }, { 'algorithm':'minmax', 'param-a':'12', 'param-b':'30', 'result-of-algorithm':[[timestamp1,value1],[timestamp3,value3]] }, { 'algorithm':'minmax', 'param-a':'12', 'param-b':'30', 'result-of-algorithm':[[timestamp2,value2],[timestamp4,value4]] }, { 'algorithm':'delta', 'param-a':'12', 'param-b':'50', 'result-of-algorithm':[[timestamp2,value2],[timestamp4,value4]] } ]

1条回答

网友

1楼 · 发布于 2024-06-28 18:57:50

所以这里有两个选项，一个是先清理dict，然后轻松地将其转换为dataframe，第二个是将其转换为dataframe，然后清理其中包含嵌套列表的列。对于第一个解决方案，您可以像这样重新构造dict：

import pandas as pd
from collections import defaultdict

data = defaultdict(list)
for roa in resultsOfAlgorithms:
    for i in range(len(roa['result-of-algorithm'])):
        data['algorithm'].append(roa['algorithm'])
        data['param-a'].append(roa['param-a'])
        data['param-b'].append(roa['param-b'])
        data['time'].append(roa['result-of-algorithm'][i][0])
        data['value'].append(roa['result-of-algorithm'][i][1])

df = pd.DataFrame(data)

In [31]: df
Out[31]:
  algorithm param-a param-b  time  value
0    minmax      12     200     1      5
1    minmax      12     200     2      8
2    minmax      12      30     1      5
3    minmax      12      30     3      4
4    minmax      12      30     2      8
5    minmax      12      30     4     12
6     delta      12      50     2      8
7     delta      12      50     4     12

从这里你可以对它做任何你需要的分析，不管是绘图还是使时间列成为索引，还是分组和聚合，等等。您可以将其与在此链接中首先生成数据帧进行比较：

Splitting a List inside a Pandas DataFrame

他们基本上做了同样的事情，把一列列表分成多行。不过，我认为修复字典会更容易，这取决于你相当简单的例子对真实数据的代表性。在

编辑：如果要将其转换为多索引，可以再添加一行：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章