我正在尝试运行一项研究,使用带有默认采样器和中值修剪器的优化函数。
每次运行都会崩溃,有时是在1次成功的测试后,有时是在没有完成任何测试的情况下。
崩溃消息为:进程结束,退出代码137(被信号9:SIGKILL中断)
预期行为
进行研究
环境
- OPT版本:
2.0.0
- Python版本:3.8
- 操作系统:带debian 10虚拟机的QubeOS
- (可选)其他库及其版本:
Pytorch“1.5.0+cpu”
错误消息、堆栈跟踪或日志
过程结束,退出代码137(被信号9:SIGKILL中断)
是什么导致了这样的错误
Tags:
一种可能的情况是,您的进程会消耗大量内存,并被操作系统的OOM杀手杀死。您可以使用
top
之类的工具监视进程的内存消耗,并查看它是否使用了大量内存您还可以在控制台中运行
dmesg
,并在输出中查找来自OOM killer的消息。OOM杀手通常会在那里打印它杀死的进程。检查进程ID是否为进程的ID如果进程确实被OOM杀手杀死,那么唯一的补救办法可能是减少程序的内存消耗(或者获得一台更大的机器)
相关问题 更多 >
编程相关推荐