使用r2PPML将10Mb的Rdata文件转换为PMML会生成350Mb的PMML文件。我怎样才能把它变小?

2024-05-19 20:53:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个RData文件,这是一个随机森林模型,它的大小是10Mb。我想把它转换成PMML,但是当使用R2PMML库时,会创建一个350Mb的PMML文件,这个文件太大了。你知道我怎么把它变小吗?我希望能够在python生产环境中使用PMML,因此需要将文件大大缩小。你知道吗


Tags: 文件模型环境森林pmmlrdatar2pmml
1条回答
网友
1楼 · 发布于 2024-05-19 20:53:53

通过指定compact = TRUE转换选项,可以重新排列决策树数据结构:

library("r2pmml")
library("randomForest")
iris.rf = randomForest(Species ~ ., data = iris)
r2pmml(iris.rf, "RandomForestIris-compact.pmml", compact = TRUE)

然而,本地文件系统中PMML文件的大小并不能很好地指示它在运行时将消耗多少内存。当正确加载时,350MB的文件可能适合50-75MB的RAM(例如,100MB的文件是空白字符)。你知道吗

相关问题 更多 >