如何在python现有pickle文件中添加新的数据集

2024-10-01 00:34:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这个pickle文件https://github.com/Nilabhra/ethnicity/blob/master/models/ethnicity_classifier_last_name.pkl,它是从json文件https://github.com/Nilabhra/ethnicity/blob/master/json_counts/last_name_ethnicity.json生成的

我的问题: 如何删除旧数据集并将新数据集放入.pkl文件。在

import pickle

ethinicity= {"Kumari": {"Hindu,Brahmin": 1.0},"Choopra": {"Jain,Digambar": 1.0}}
pickle.dump(ethinicity, open("ethnicity_classifier_last_name.pkl", "wb"))

但是,由上面的代码生成的pickle文件具有不同的结构,因此在运行此代码时它会抛出错误


Tags: 文件数据namehttpsgithubmastercomjson
2条回答

删除旧的pickle文件并转储包含新数据集的新pickle文件。在

在写入pickle文件之前,需要用新条目更新旧dict

import pickle 
import json

#Loading the old json
old_ethnicity = json.load(open('last_name_ethnicity.json','rb'))
ethinicity= {"Kumari": {"Hindu,Brahmin": 1.0},"Choopra": {"Jain,Digambar": 1.0}}

#Add the changes to old dict
new_ethnicity = dict(old_ethnicity, **ethinicity)
pickle.dump(new_ethnicity, open("ethnicity_classifier_last_name.pkl", "wb"))`

相关问题 更多 >