PySpark ML LogisticReturnal weightCol是否实现了sampleWeight或classWeight?

2024-10-02 02:33:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在PySpark ML中定义一个二进制LogisticRegression管道,用于一个很大程度上不兼容的数据集

lr = LogisticRegression(maxIter=10, regParam=0.001, weightCol="weight")

API包含一个weightCol='weight'选项,我想将其用于我的不平衡数据集。Pyspark 2.3.0的文档

weightCol = Param(parent='undefined', name='weightCol', doc='weight column name. If this is not set or empty, we treat all instance weights as 1.0.')

是的,非常冗长

这是样本重量还是类别重量

我在文件的其他地方找不到关于这方面的任何信息


Tags: 数据name管道定义二进制mlpysparkweight

热门问题