大数据集,插值

2024-09-28 16:18:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找一个“方法”来得到一个公式,公式来自拟合一组数据(3000点)。我使用的是勒让德多项式,但对于20分以上的分数,它给出的数值并不精确。我可以编写chi2 test,但是算法需要大量的时间来计算N个参数,而且在开始的时候我不知道函数是什么样子的,所以需要时间。我在想样条线。。。也许 吧。。。在

所以输入量是:3000品脱

输出:f(x)=。。。什么

我想从fit得到一个公式。在python中最好的方法是什么?在

让原力与我们同在! 尼康


Tags: 数据方法函数test算法参数时间分数
3条回答

唯一的公式是3000阶多项式。在

合身需要多好?你想要什么样的配方?在

但是,样条曲线不会给你一个“公式”,至少除非你有足够的资金来处理所有的分段段。即便如此,它也不会轻易写下来,也不会给你任何好看的东西。在

一条简单的样条线提供了一个插值。更糟糕的是,对于3000个点,插值样条线将提供大致如此多的三次段!你以前说过插值。当然,一个高阶的插值多项式无论如何都是完全的,所以不要以为你能回到那里。在

如果你所需要的只是一个能在任何点提供精确插值的工具,而且你真的不需要一个明确的公式,那么插值样条线是一个不错的选择。在

或者你真的想要一个亲近的人?一个函数可以近似地拟合你的数据,消除任何噪音?事实上,很多时候,当不知道自己在做什么的人说“插值”时,他们实际上是指近似、平滑。这当然是可能的,但是有整本书都是关于曲线拟合,经验数据建模的。您的第一个目标是选择一个智能模型,它将代表这些数据。当然,最好的方法是,如果你对所研究的关系的物理理解中有一些明智的模型选择,那么你可以使用一个非线性回归方案来估计该模型的参数,其中有许多可以找到。在

如果你没有模型,又不愿意选择一个大致形状合适的模型,那么你只剩下样条曲线形式的通用模型,可以在回归意义上进行拟合,或者使用高阶多项式模型,我对此不太尊重。在

我想说的是,你需要做出一些选择,并对模型的选择做一些研究。在

多项式拟合如何:

http://docs.scipy.org/doc/numpy/reference/generated/numpy.polyfit.html

或其他插值方案:

http://docs.scipy.org/doc/scipy/reference/tutorial/interpolate.html

如果不了解数据集的更多信息以及需要多好的拟合度,很难推荐合适的方法。在

相关问题 更多 >