删除很长时间序列中的假日和周末,如何用Python建模时间序列?

2024-10-01 19:25:22 发布

您现在位置:Python中文网/ 问答频道 /正文

Python中有什么函数可以处理这个问题吗。GoogleDocs有一个工作日操作,所以Python中可能有类似的东西。我很肯定有人已经解决了这个问题,类似的问题也出现在稀疏的数据中,比如金融和研究领域。我基本上只是在尝试组织大量不同大小的向量,按天,时间序列索引,我不确定我应该如何安排这些天——第一天用1标记,最后一天用N或unix时间标记,或者应该怎么做?我不确定是否应该将时间序列保存到矩阵中,这样我就可以更容易地对它们进行建模,以计算相关矩阵之类的东西,有没有准备好做这些事情的事情?在

让我们试着在没有“实际”的额外混乱的情况下解决这个问题:

import itertools
seq = range(100000)
criteria  = cycle([True]*10 + [False]*801)
list(compress(seq, criteria))

现在必须将它们改为days,然后将$\mathbb R$更改为$(\mathbb R,\mathbb R)$,元组。所以$V:\mathb R\mapsto\mathb R^{2}$丢失,正在调查。在

[更新]

我们玩吧!下面的代码解决了子问题——创建一些测试数据来测试东西——现在我们需要创建任意的日期和赋值,以尝试在任意时间序列上测试它。如果我们可以创建一些函数$V$,我们很快就能解决这个问题了…它必须考虑到假期和周末,所以可能不容易(不确定)。在

^{pr2}$

Tags: 数据函数标记时间序列事情向量金融
3条回答

我认为你应该找出你想包括的日子,并创建一个(可能是循环)子程序,在你的大名单上使用切片操作。在

对于不连续切片,您可以看看这个问题:

Discontinuous slice in python list

或者你可以让你不想要的日子收到一个空值(零或无)。在

“我认为这是一个很好的日期索引问题,我认为这是一个好的范围,你的日历。在

一个人的生命长达200年,大约7.3万天,简单地计算并记录下来,也许可以用口述,例如

day = {}
# day[0] = [event_a, event_b, ...]
# or you may want to rewrite the __getitem__ method like this: day['09-05-2012']

尝试使用pandas。您可以为工作日创建DateOffset,并将您的数据包含在DataFrame(请参见:http://pandas.pydata.org/pandas-docs/stable/timeseries.html)中进行分析。在

相关问题 更多 >

    热门问题