从包含多个键的字典列表创建pandas timeseries

2024-06-28 18:57:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我有多个时间序列,是各种算法的输出。这些算法可以有不同的参数,因此会产生时间序列:

timestamp1=1;
value1=5;
timestamp2=2;
value2=8;
timestamp3=3;
value3=4;
timestamp4=4;
value4=12;

resultsOfAlgorithms=[
{
'algorithm':'minmax',
'param-a':'12',
'param-b':'200',
'result-of-algorithm':[[timestamp1,value1],[timestamp2,value2]]
},
{
'algorithm':'minmax',
'param-a':'12',
'param-b':'30',
'result-of-algorithm':[[timestamp1,value1],[timestamp3,value3]]
},
{
'algorithm':'minmax',
'param-a':'12',
'param-b':'30',
'result-of-algorithm':[[timestamp2,value2],[timestamp4,value4]]
},
{
'algorithm':'delta',
'param-a':'12',
'param-b':'50',
'result-of-algorithm':[[timestamp2,value2],[timestamp4,value4]]
}
]

我希望能够通过算法和参数过滤timeseries,并绘制过滤后的timeseries,看看给定的参数如何影响输出。为此,我需要知道给定参数的所有发生值,然后才能选择具有所需参数的时间序列。E、 g.我想用param-b==30绘制minmax算法的所有结果。有2个结果是用minmax算法产生的,param-b==30。因此,我想有一个2时间序列在其中的情节。在

这是可能的熊猫还是这是熊猫的功能?如何实现这一点?在

编辑: 我想我正在寻找一种使用层次索引的方法。时间序列也应该分开。每个结果都是一个单独的时间序列。它不应该与其他结果合并在一起。我需要根据使用的参数过滤算法的结果。filter的结果应该仍然是timeseries的列表。在

编辑2: 有多个子问题:

  1. 查找每个参数的所有现有值(用户不知道所有值,因为参数可以由系统自动生成)

  2. 用户选择一些值进行筛选 用户可以提供的一种方法是词典(但欢迎使用更友好的想法):

    过滤器={ '参数b':[30,50], “算法”:“minmax” }

  3. 算法结果[1:2](第2和第3个结果)的时间序列作为过滤的结果给出,因为这些结果是由minmax算法生成的,param-b为30。因此,在这种情况下

    在[ [[时间戳1,值1],[时间戳3,值3]], [[时间戳1,值1],[时间戳3,值3]] ]

  4. 过滤的结果将返回多个时间序列,我想对其进行绘图和比较。

  5. 用户希望尝试各种过滤器来查看它们对结果的影响

我把这一切都写在朱皮特笔记本上。我想让用户尽可能少的麻烦尝试各种过滤器。在

不共享结果中的时间戳。结果之间的时间戳不一定是共享的。E、 g.所有的时间序列可能发生在下午1点到3点之间,并且具有完全相同的值量,但是时间戳和值的数量不完全相同。在


Tags: of用户算法参数param时间序列result
1条回答
网友
1楼 · 发布于 2024-06-28 18:57:50

所以这里有两个选项,一个是先清理dict,然后轻松地将其转换为dataframe,第二个是将其转换为dataframe,然后清理其中包含嵌套列表的列。对于第一个解决方案,您可以像这样重新构造dict:

import pandas as pd
from collections import defaultdict

data = defaultdict(list)
for roa in resultsOfAlgorithms:
    for i in range(len(roa['result-of-algorithm'])):
        data['algorithm'].append(roa['algorithm'])
        data['param-a'].append(roa['param-a'])
        data['param-b'].append(roa['param-b'])
        data['time'].append(roa['result-of-algorithm'][i][0])
        data['value'].append(roa['result-of-algorithm'][i][1])

df = pd.DataFrame(data)

In [31]: df
Out[31]:
  algorithm param-a param-b  time  value
0    minmax      12     200     1      5
1    minmax      12     200     2      8
2    minmax      12      30     1      5
3    minmax      12      30     3      4
4    minmax      12      30     2      8
5    minmax      12      30     4     12
6     delta      12      50     2      8
7     delta      12      50     4     12

从这里你可以对它做任何你需要的分析,不管是绘图还是使时间列成为索引,还是分组和聚合,等等。您可以将其与在此链接中首先生成数据帧进行比较:

Splitting a List inside a Pandas DataFrame

他们基本上做了同样的事情,把一列列表分成多行。不过,我认为修复字典会更容易,这取决于你相当简单的例子对真实数据的代表性。在

编辑:如果要将其转换为多索引,可以再添加一行:

^{pr2}$

相关问题 更多 >