将Pandas数据帧传递到Scipy.optimize.curve\u fi

1条回答

网友

1楼 · 发布于 2024-05-05 12:21:57

您对curve_fit的调用不正确。来自the documentation：

xdata : An M-length sequence or an (k,M)-shaped array for functions with k predictors.
The independent variable where the data is measured.
ydata : M-length sequence
The dependent data — nominally f(xdata, ...)

在这种情况下，您的自变量xdata是列A到D，即table[['A', 'B', 'C', 'D']]，而您的自变量ydata是table['Z_real']。

还要注意xdata应该是一个（k，M）数组，其中k是预测变量（即列）的数目，M是观测值（即行）的数目。因此，您应该对输入数据帧进行转置，使其成为（4，M），而不是（M，4），即table[['A', 'B', 'C', 'D']].T。

对curve_fit的整个调用可能如下所示：

curve_fit(func, table[['A', 'B', 'C', 'D']].T, table['Z_real'])

下面是一个显示多元线性回归的完整示例：

import numpy as np
import pandas as pd
from scipy.optimize import curve_fit

X = np.random.randn(100, 4)     # independent variables
m = np.random.randn(4)          # known coefficients
y = X.dot(m)                    # dependent variable

df = pd.DataFrame(np.hstack((X, y[:, None])),
                  columns=['A', 'B', 'C', 'D', 'Z_real'])

def func(X, *params):
    return np.hstack(params).dot(X)

popt, pcov = curve_fit(func, df[['A', 'B', 'C', 'D']].T, df['Z_real'],
                       p0=np.random.randn(4))

print(np.allclose(popt, m))
# True

相关问题更多 >

编程相关推荐

热门问题

热门文章

将Pandas数据帧传递到Scipy.optimize.curve\u fi

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >