python机器学习代码中的内存泄漏问题

import uvicorn from fastapi import FastAPI from fastapi.encoders import jsonable_encoder from fastapi.responses import JSONResponse from pydantic import BaseModel import pickle from transformers.pipelines import pipeline class QAItem(BaseModel): context: str question:str with open('model_pickle','rb') as file: nlp = pickle.load(file) app=FastAPI() @app.post('/api') def qanda(data:QAItem): data=data.dict() item=nlp(question=data['question'], context=data['context'], handle_impossible_answer=True, max_answer_len=500) json_compatible_item_data=jsonable_encoder(item) return JSONResponse(json_compatible_item_data) if __name__=='__main__': uvicorn.run(app,host='0.0.0.0', port=8080)

1条回答

网友

1楼 · 发布于 2024-06-15 04:01:17

我对基于transformer的NLP模型的经验是，它们要求很高，有时会泄漏内存

例如，我对Facebook的Bart大型CNN模式（用于总结）存在问题，该模式的表现几乎相同（内存不断增加）

一个糟糕的解决方法是限制Docker容器使用的最大内存量，这样，一旦达到限制，Docker就会重新启动容器并释放所有内存。这不是100%满意，但它的工作，你不会打破你的主机

相关问题更多 >

编程相关推荐

热门问题

热门文章