DecisionTreeClassificationModel如何在PySpark中解析和可视化决策树?

2024-05-20 16:45:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个DecisionTreeClassifier(classDecisionTreeClassificationModel)安装的模型,需要解析它的树节点,以便可视化一个子集或整个树,但是PySpark API中可用的方法似乎非常有限。 例如,我想取nodeN并得到它的父节点或所有叶子。 使用pysparkapi这可能吗?到目前为止,我所能做的就是打电话给:

model.toDebugString()

并解析字符串以重新创建树结构。你知道吗

我看到Java API提供了更多选项,但我不知道如何在PySpark脚本中使用它。你知道吗

我在网上还发现有一个spark-tree-plotting包,它甚至可以可视化树,但是我在尝试安装它时遇到了一些失败(似乎不再维护它)。你知道吗

如果有任何关于如何有效解析模型返回的决策树的提示,我将不胜感激。你知道吗


Tags: 方法字符串模型apimodel节点可视化子集