可能的错误interp系列

2024-10-02 02:40:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在多个DataFrame或系列之间对齐索引值,我使用 系列插值但它似乎没有正确地插值。或者我误解了什么。下面是一个小例子:

x1 = np.array([0, 0.25, 0.77, 1.2, 1.4, 2.6, 3.1])
y1 = np.array([0, 1.1, 0.5, 1.5, 1.2, 2.1, 2.4])
x2 = np.array([0, 0.25, 0.66, 1.0, 1.2, 1.4, 3.1])
y2 = np.array([0, 0.2, 0.8, 1.1, 2.2, 0.1, 2.4])

df1 = DataFrame(data=y1, index=x1, columns=['A'])
df1.plot(marker='o')

df2 = DataFrame(data=y2, index=x2, columns=['A'])
df2.plot(marker='o')

df3=df1 - df2
df3.plot(marker='o')
print df3

def resample(signals):
    aligned_x_vals = reduce(lambda s1, s2: s1.index.union(s2.index), signals)
    return map(lambda s: s.reindex(aligned_x_vals).apply(Series.interpolate), signals)

sig1, sig2 = resample([df1, df2])
sig3 = sig1 - sig2
plt.plot(df1.index, df1.values, marker='D')
plt.plot(sig1.index, sig1.values, marker='o')
plt.grid()
plt.figure()
plt.plot(df2.index, df2.values, marker='o')
plt.plot(sig2.index ,sig2.values, marker='o')
plt.grid()

我希望sig1和sig2比df1和df2有更多的点,但是值是内插的。有几个点没有重叠。这是错误还是用户错误?我用的是v0.7.3

谢谢。在


Tags: dataframeindexplotnppltarraymarker插值
2条回答

它可能是个bug。查看源代码,Series.interpolate在进行插值时不查看索引值。它假设它们的间距相等,并且只使用len(serie)作为索引。也许这是我的意图,而不是一个错误。我不确定。在

我修改了Series.interpolate方法,并提出了这个interpolate函数。这会做你想做的。在

import numpy as np
from pandas import *

def interpolate(serie):
    try:
        inds = np.array([float(d) for d in serie.index])
    except ValueError:
        inds = np.arange(len(serie))

    values = serie.values

    invalid = isnull(values)
    valid = -invalid

    firstIndex = valid.argmax()
    valid = valid[firstIndex:]
    invalid = invalid[firstIndex:]
    inds = inds[firstIndex:]

    result = values.copy()
    result[firstIndex:][invalid] = np.interp(inds[invalid], inds[valid],
                                             values[firstIndex:][valid])

    return Series(result, index=serie.index, name=serie.name)

我不认为基础数学应用插值和等于插值求和。只有在特殊情况下才有效

相关问题 更多 >

    热门问题