Matplotlib和Pyplot.close()不释放内存?后端相关Qt4Agg

2024-06-01 13:25:38 发布

您现在位置:Python中文网/ 问答频道 /正文

编辑:如果我明确地将matplotlib的后端从'Qt4Agg'改为'Agg',那么我就可以运行我的代码而没有错误。我认为这是后端的一个bug?在

我正在写一些代码来自动处理大量的数据。代码首先解析我的数据文件并存储所有相关的位。然后我有不同的函数来生成我需要的每一个图(总共大约有25个)。但是,我一直遇到某种内存错误,我想这是因为Matplotlib/PyPlot没有正确释放内存。在

每个绘图函数以pyplot.close(fig)命令,因为我只想保存图形,而不是立即查看它们,所以它们包含了一个pyplot.show显示(). 在

如果我在解释器中单独运行绘图功能,那么我不会遇到任何问题。但是,如果我创建一个单独的函数,依次调用每个绘图函数,那么我会遇到一个“MemoryError:couldnotallocatememorforpath”。在

有人遇到过这样的问题吗?它似乎与Matplotlib runs out of memory when plotting in a loop有关,但是pyplot.close()不能解决我的问题。在

在我的代码中,典型的plot函数是这样的:

def TypicalPlot(self, title=None, comment=False, save=False, show=True):

    if title is None:
        title = self.dat.title

    fig = plt.figure()
    host = SubplotHost(fig, 111)
    fig.add_subplot(host)
    par = host.twinx()
    host.set_xlabel("Time (hrs)")
    host.set_ylabel("Power (W)")
    par.set_ylabel("Temperature (C)")
    p1, = host.plot(self.dat.timebase1, self.dat.pwr, 'b,', label="Power",
                    markevery= self.skip)
    p2, = par.plot(self.dat.timebase2, self.dat.Temp1, 'r,', 
                   label="Temp 1", markevery= self.skip)
    p3, = par.plot(self.dat.timebase2, self.dat.Temp2, 'g,', 
                   label="Temp 2", markevery= self.skip)
    p4, = par.plot(self.dat.timebase2, self.dat.Temp3, 'm,', 
                   label="Temp 3", markevery= self.skip)
    host.axis["left"].label.set_color(p1.get_color())
    # par.axis["right"].label.set_color(p2.get_color())
    #host.legend(loc='lower left')
    plt.title(title+" Temperature")

    leg=host.legend(loc='lower left',fancybox=True)
    #leg.get_frame().set_alpha(0.5)
    frame  = leg.get_frame()
    frame.set_facecolor('0.80')

    ### make the legend text smaller
    for t in leg.get_texts():
        t.set_fontsize('small')

    ### set the legend text color to the same color as the plots for added
    ### readability
    leg.get_texts()[0].set_color(p1.get_color())
    leg.get_texts()[1].set_color(p2.get_color())
    leg.get_texts()[2].set_color(p3.get_color())    
    leg.get_texts()[3].set_color(p4.get_color())        

    if show is True and save is True:
        plt.show()
        plt.savefig('temp.png')
    elif show is True and save is False:
        plt.show()
    elif show is False and save is True:
        plt.savefig('temp.png')
        plt.clf()
        plt.close(fig)

如果我现在在候机楼里跑

^{pr2}$

那我就不会出错了。我所有的绘图函数也是如此。在

如果我创建一个新函数:

def saveAllPlots(self, comments = False):

        if self.comment is None: comment = False
        else: comment = True
        self.TypicalPlot(save=True, show=False, comment=comment)
        self.AnotherPlot(save=True, show=False)
        self.AnotherPlot2(save=True, show=False)
        self.AnotherPlot3(save=True, show=False)
        ...etc, etc, etc

然后它运行了大约一半的图,然后得到“MemoryError:couldnotallocatememorforpath”。在


Tags: 函数selffalsetruehostgettitleis
2条回答

我认为它这样做的原因是,当它遍历所有不同的图形时,它会耗尽内存,可能是因为它没有正确地释放它。在

为什么不尝试创建大约3个左右的程序,每一个程序执行几个图形,而不是一个程序执行所有图形:

方案1:图表1-8

方案2:图表9-16

方案3:图17-25

希望这能帮助@FakeDIY:)

我曾经遇到过一个非常相似的问题。我假设matplotlib在内部保存每个绘图的引用。给出以下代码,创建三个单独的图形:

import matplotlib.pyplot as plt
import numpy as np

# block 1
f, ax = plt.subplots(1)
plt.plot(np.arange(10), np.random.random(10))
plt.title("first")
print 'first', sys.getrefcount(f), sys.getrefcount(ax)

# bock 2
f, ax = plt.subplots(1)
plt.plot(np.arange(10), np.random.random(10)+1)
plt.title("second")
print 'second', sys.getrefcount(f), sys.getrefcount(ax)

# block 3
f, ax = plt.subplots(1)
plt.plot(np.arange(10), np.random.random(10)+2)
plt.title("third")
print 'third', sys.getrefcount(f), sys.getrefcount(ax)

plt.show()

print 'after show', sys.getrefcount(f), sys.getrefcount(ax)

输出:

^{2}$

这是违反直觉的,因为我们多次重新定义了f和{}。 对于每个块,我们创建了一个新图形,可以通过plt来引用它。创建另一个图形会更改plt可访问的最上面的引用。但是必须有一些内部引用,它允许plt.show()显示所有图形。这些引用似乎是持久的,因此gc不会收集这些数据。在

我解决的办法是改变绘图数据。事后看来,这是一个更好的方法:

plt.ion()
f, ax = plt.subplots(1)
line = ax.plot(np.arange(10), np.random.random(10))[0]
plt.title('first')
plt.show()

for i, s in [(2, 'second'), (3, 'third')]:
    x = np.arange(10)
    y = np.random.random(10)+i
    line.set_data(x, y)
    ax.set_xlim(np.min(x), np.max(x))
    ax.set_ylim(np.min(y), np.max(y))
    plt.title(s)
    plt.draw()
    raw_input(s)

唯一的缺点是你必须保持打开的图形窗口。如果没有raw_input,程序将只运行一次

相关问题 更多 >