Python中文
首页
教程
问答
标签
搜索
登录
注册
内存泄漏Python,在for循环中列出
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我编写了一个简单的代码片段来处理一个文本文件,其中每行包含一个词组和词性标记词(例如I/noun am/verb),我想分别提取单词和标记:</p> <pre><code>splitted_sentences = [] splitted_pos = [] with open("my_path", "r") as tagged_sentences: for sentence in tagged_sentences: curr_sentence = [] curr_pos = [] for tag in sentence.strip().split(" "): splitted_tag = tag.split("/") word = splitted_tag[0] pos = splitted_tag[1] curr_sentence.<a href="https://www.cnpython.com/list/append" class="inner-link">append</a>(word) curr_pos.append(pos) splitted_sentences.append(curr_sentence) splitted_pos.append(curr_pos) </code></pre> <p>代码如预期的那样工作,但是,当循环执行得远远超过预期时,内存内存内存消耗从未停止增长(文本文件约为100MB,ram消耗峰值为5GB)。我尝试过使用一些内存分析工具,看起来我正在创建数千个列表引用(可能是curr_语句和curr_pos列表)。在不发生内存泄漏的情况下,解决这个问题的正确方法是什么?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>将curr_语句和curr_pos移到for循环之外。然后你可以清除而不是创建新的。我的猜测是,由于某种原因,curr_语句和curr_pos列表不会在for循环的末尾被删除。在</p> <p>通过将这些列表移到for循环之外,您不会在每次迭代中创建新的列表。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
3 回答
尽管python中的表达式为false,但循环仍在运行
9 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
2 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
7 回答
尽管python字典包含了大量的条目,但它并没有增长
1 回答
尽管python说模块存在,为什么我会得到这个消息?
3 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
1 回答
尽管stdout和stderr重定向,但未捕获错误消息
1 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
10 回答
尽管tkinter上的变量已更改,但显示未更改
6 回答
尽管try/except使用Python进行单元测试时出现断言错误
7 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
3 回答
尽管url有效,Pandas仍读取url的\u csv错误
10 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
8 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
7 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
9 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
10 回答
尽管下载了i,但找不到型号“fr”
6 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
1 回答
尽管为所有行指定了权重,网格(0)仍不起作用
10 回答