了解文档中如何使用DPPy以及如何将其应用于RealD

2024-10-01 00:21:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图使用Determinantal Point Processes(DPPs)来“建模”我的数据分布,特别是任务的“执行时间”。为了更清楚,我有一个数据集,其中包含order_idwait_time列(由于保密原因,我无法共享这些列),它记录了客户等待订单的时间(以秒为单位)

到目前为止,我只使用内部的sklearn分布(参考How to find probability distribution and parameters for real data? (Python 3))获得了最佳拟合分布。我最近偶然发现了文章https://arxiv.org/abs/1809.07258,其中有一个Python实现

我仍在试图理解文档的某些部分,比如https://dppy.readthedocs.io/en/latest/finite_dpps/definition.htmlhttps://dppy.readthedocs.io/en/latest/finite_dpps/exact_sampling.html#finite-dpps-exact-sampling-k-dpps。我的目标是获得下一年(如2015年)数据的模拟样本,使用上述2014年的当前数据集,例如

是否可以利用dppy使用我当前的数据集获取这些模拟样本?我目前正在查看documentation中的以下代码以获取示例:

import numpy as np
from dppy.finite_dpps import FiniteDPP

rng = np.random.RandomState(1)

r, N = 5, 10
# Random feature vectors
Phi = rng.randn(r, N)
DPP = FiniteDPP('likelihood', **{'L': Phi.T.dot(Phi)})

k = 4
for _ in range(10):
    DPP.sample_exact_k_dpp(size=k, random_state=rng)

print(list(map(list, DPP.list_of_samples)))

我是否走上了正确的道路,或者我只是对dppy在我的案例中的应用有一个很大的误解

我知道这个网站可能不适合这个问题,但如果我能从我的发现和理解中得到一些指导和/或建议,那就太好了,DPP还没有(可能有,但无法找到示例)在Python中为我这样的用例实现


Tags: 数据httpsioforreadthedocs时间listexact