三维均匀网格中随机散乱数据的插值与外推问题的回答

三维均匀网格中随机散乱数据的插值与外推

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

这种讨论适用于任何维度。对于你的3D例子，让我们先谈谈计算几何，来理解为什么部分区域从<code>griddata</code>给出<code>NaN</code>。在 体积中的分散点构成了一个具有以下特性的几何图形： <ul> <li>表面总是凸的（顾名思义）</li> <li>在不破坏凸性的情况下，形状的体积是尽可能小的</li> <li>曲面（在3d中）是三角剖分和闭合的</li> </ul> 不那么正式，凸壳（<a href="https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.Delaunay.html" rel="nofollow noreferrer">which you can compute easily with scipy</a>）就像是在一个框架上拉伸一个气球，框架的角点是分散的簇的最外面的点。在 在气球内部的规则网格位置，你被已知的点包围着。可以对这些位置进行插值。在它之外，你必须推断。在 外推法是很难的。没有一般的规则来解释。。。这是具体问题。在这个区域，像<code>griddata</code>这样的算法选择返回<code>NaN</code>-这是通知科学家必须选择一种合理的推断方式的最安全的方法。在 让我们来看看做那件事的一些方法。在 <h3>1。[最差]搞砸</h3> 在外壳外部指定一些标量值。<a href="https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.interpolate.griddata.html" rel="nofollow noreferrer">In the numpy docs</a>您将看到这是通过以下方式完成的： s=平均值（b） bCube=网格数据（（x，y，z），b，（x，y，z），方法='线性'，填充值=s） 缺点：这会在赫尔边界的插值场中产生尖锐的不连续性，严重偏离平均标量场值，并且不尊重数据的函数形式。在 <h3>2。[下一个最差]“混搭”</h3> 假设在你的域的角落，你应用了一些值。这可能是与分散点相关联的标量场的平均值。在 抱歉，这是伪代码，因为我根本不使用numpy，但可能会很清楚 <pre><code># With a unit cube, and selected scalar value x, y, z, b = np.loadtxt(scatteredfile, unpack = True) s = mean(b) x.append([0 0 0 0 1 1 1 1]) y.append([0 0 1 1 0 0 1 1]) z.append([0 1 0 1 0 1 0 1]) b.append([s s s s s s s s]) # drop in the rest of your code </code></pre> 缺点：这会在赫尔边界的插值场的梯度中产生尖锐的不连续性，相当严重地偏差平均标量场值，并且不尊重数据的函数形式。在 <h3>3。[仍然相当糟糕]最近的邻居</h3> 对于每个常规的NaN点，找到最近的非NaN点并分配该值。这是有效和稳定的，但粗糙的，因为你的领域可以结束图案特征（如条纹或光束从船体辐射出去），往往视觉上不吸引人，或更糟糕的是，在数据平滑方面不可接受 根据数据的密度，可以使用最近的分散数据点，而不是最近的非NaN规则点。这可以通过（再次，伪代码）来实现： ^{pr2}$ 使用MATLAB基于delaunay的方法将揭示在一行代码中实现类似功能的更强大的方法，但是numpy在这里看起来有点有限。在 <h3>4。[不总是很糟糕]自然权重</h3> 很抱歉在这一节中解释得不好，我从来没有写过算法，但我相信对自然邻域技术的一些研究会让你远远地 使用带有某个参数<code>D</code>的距离加权函数，该参数可能与长方体的长度相似，或者是长方体长度的两倍。你可以调整。对于每个NaN位置，计算到每个分散点的距离。在 <pre><code># Don't do it this way for anything but small matrices - this is O(NM) # and it can be done much more effectively (e.g. MATLAB has a quick # natural weighting option), but for illustrative purposes: for each NaN point 1:N for each scattered point 1:M calculate a basis function using inverse distance from NaN to point, normalised on D, and store in a [1 x M] vector of weights Multiply weights by the b value, summate and divide by M </code></pre> 你基本上想得到一个函数，它在离船体的距离D处，平滑地达到B的平均强度，但在边界处与船体重合。在远离边界的地方，它在最近的点上的权重最大。在 优点：非常稳定，并且相当连续。由于加权，在单个数据点比最近邻点更能抵抗噪声。在 <h3>5。【英雄摇滚明星】功能形式假设</h3> 你对物理学了解多少？假设函数一种形式，它代表了你期望物理所做的事情，然后对散乱的数据进行最小二乘（或类似的）拟合。使用函数稳定外推法。在 一些有助于构建函数的好主意： <ul> <li>你期望对称性还是周期性？在</li> <li>b是向量场的一个分量吗？它有一些像零散度的性质？在</li> <li>方向性：你希望所有的角都一样吗？或者是一个方向上的线性变化？在</li> <li>字段b是在某个时间点上吗？也许可以使用平滑的时间序列来获得一个基本函数？在</li> <li>有没有已知的形式，像高斯或二次方？在</li> </ul> 一些例子： <ul> <li>b代表通过一个物体的激光束的强度。你期望入口侧名义上与出口相同，其他四个边界为零强度。强度将具有同心高斯分布。</li> <li>b是不可压缩流体中速度场的一个分量。流体必须是无散度的，所以在NaN区域产生的任何场也必须是无散度的，所以你应用这个条件。</li> <li>b代表房间的温度。你期望顶部温度更高，因为热空气上升。</li> <li>b代表机翼上的升力，通过三个独立变量进行测试。你可以很容易地在停机坪查看电梯，所以要确切地知道它在空间的某些部分会是什么。</li> </ul> 优点/缺点：把这件事做好，那就太棒了。如果弄错了，特别是非线性函数形式，它将变得非常错误，并可能导致非常不稳定的结果。在 健康警告你不能假设一个函数形式，得到很好的结果，然后用它们来证明函数形式是正确的。那真是糟糕的科学。表单需要表现良好并且与数据分析无关。在

三维均匀网格中随机散乱数据的插值与外推

1 个回答

相关Python问题