如何找到决策树分类的特征名称?

2024-05-03 08:24:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试查找决策树的特征信息。更具体地说,如果183出现在我的树可视化中,我想知道它是什么。我尝试了dtModel.getInputCol(),但收到以下错误

AttributeError: 'DecisionTreeClassificationModel' object has no attribute 'getInputCol'

这是我当前的代码:

from pyspark.ml.classification import DecisionTreeClassifier

# Create initial Decision Tree Model
dt = DecisionTreeClassifier(labelCol="label", featuresCol="features", maxDepth=3)

# Train model with Training Data
dtModel = dt.fit(trainingData)
display(dtModel)

如果您能提供帮助或需要更多信息,请告诉我。多谢各位


Tags: no信息决策树object可视化错误dtattribute
1条回答
网友
1楼 · 发布于 2024-05-03 08:24:10

请参见取自Spark doc的示例(我试图使名称与您的代码保持一致,尤其是featuresCol="features"

我假设您有一些这样的代码(在问题中发布的代码之前):

featureIndexer = VectorIndexer(inputCol="inputFeatures", outputCol="features", maxCategories=4).fit(data)

在此步骤之后,将"features"作为索引特征,然后将其馈送到DecisionTreeClassifier(与发布的代码类似):

# Train a DecisionTree model.
dt = DecisionTreeClassifier(labelCol="indexedLabel", featuresCol="features")

您要查找的是上面的inputFeatures,这是索引之前的原始功能。如果要打印,只需执行以下操作:

sc.parallelize(inputFeatures, 1).saveAsTextFile("absolute_path") 

相关问题 更多 >