为什么scipy.optimize.curve_fit不能为我的点生成最佳拟合线?

2024-10-06 20:28:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图绘制多个重复R-T测量的数据集,并使用scipy.optimize.curve_fit拟合每个数据集的最佳拟合立方根线

我的代码为每个数据集生成一行,但不是最佳拟合的立方根线。每个数据集都按照其对应的最佳拟合行进行颜色编码:

我尝试过增加数据的数量级,因为我听说有时候scipy.optimize.curve_fit不喜欢非常小的数字,但这没有改变。如果有人能指出我错在哪里,我将不胜感激:

import numpy as np
from scipy.optimize import curve_fit 
import scipy.optimize as scpo
import matplotlib.pyplot as plt    

files = [ '50mA30%set1.lvm','50mA30%set3.lvm', '50mA30%set4.lvm', 
'50mA30%set5.lvm']

for file in files:
                                    
    data = numpy.loadtxt(file)                     
      
    current_YBCO = data[:,1] 
    voltage_YBCO = data[:,2] 
    current_thermometer = data[:,3]
    voltage_thermometer = data[:,4]
    T = data[:,5]

    R = voltage_thermometer/current_thermometer
    p = np.polyfit(R, T, 4)
    T_fit = p[0]*R**4 + p[1]*R**3 + p[2]*R**2 + p[3]*R + p[4] 
    y = voltage_YBCO/current_YBCO
    
    def test(T_fit, a, b, c): 
        return a * (T_fit+b)**(1/3) + c

    param, param_cov = curve_fit(test, np.array(T_fit), np.array(y), 
    maxfev=100000) 

    ans = (param[0]*(np.array(T_fit)+param[1])**(1/3)+param[2])

    plt.scatter(T_fit,y, 0.5)
    plt.plot(T_fit, ans, '--', label ="optimized data") 
    plt.xlabel("YBCO temperature(K)")
    plt.ylabel("Resistance of YBCO(Ohms)")
    plt.xlim(97, 102)
    plt.ylim(-.00025, 0.00015)

Tags: 数据importdataparamnppltscipycurrent
1条回答
网友
1楼 · 发布于 2024-10-06 20:28:02

有两件事让你更难接受

首先,numpy数组的负数的立方根。如果您尝试此方法,您会发现您没有得到想要的结果:

x = np.array([-8, 0, 8])
x**(1/3)  # array([nan,  0.,  2.])

这意味着test函数在任何时候获得负值时都会出现问题,您需要负值来创建曲线的左侧。相反,使用np.cbrt

x = np.array([-8, 0, 8])
np.cbrt(x) # array([-2.,  0.,  2.])

其次,你的功能是

def test(T_fit, a, b, c):
    return a * (T_fit + b)**(1/3) + c

不幸的是,这与您显示的图表不太相似。这使得优化很难找到“好”的匹配。我特别不喜欢这个函数的地方是

  • 它在T_fit == b处垂直移动。你的数据在这一点上有一个明确的斜率
  • 它在远离T_fit = b的地方持续强劲增长。你的数据是水平的

然而,有时可以通过给优化提供一个良好的起点来获得更“合理的拟合”

你没有给我们任何代码来工作,这使得这更加困难。因此,作为说明,请尝试以下方法:

import matplotlib.pyplot as plt
import numpy as np
import scipy.optimize

fig, ax = plt.subplots(1)

# Generate some data which looks a bit like yours
x = np.linspace(95, 105, 1001)
y = 0.001 * (-0.5 + 1/(1 + np.exp((100-x)/0.5)) + 0.125 * np.random.rand(len(x)))

# A fitting function
def fit(x, a, b, c):
    return a * np.cbrt((x + b)) + c

# Perform the fitting
param, param_cov = scipy.optimize.curve_fit(fit, x, y, p0=[0.004, -100, 0.001], maxfev=100000)

# Calculate the fitted data:
yf = fit(x, *param)
print(param)

# Plot data and the fitted curve
ax.plot(x, y, '.')
ax.plot(x, yf, '-')

现在,如果我运行这段代码,我会得到一个大致跟随数据的拟合。但是,如果我进行初步猜测,即通过调用

param, param_cov = scipy.optimize.curve_fit(fit, x, y, maxfev=100000)

那就更糟糕了。原因是curve_fit将从[1, 1, 1]的初始猜测开始。看起来大致正确的解决方案位于与[1, 1, 1]不同的山谷中,因此它不是找到的解决方案。换句话说,它只找到局部最小值,而不是全局最小值

相关问题 更多 >