如何用lightgbm python编写多类分类中的自定义F1评分指标问题的回答

如何用lightgbm python编写多类分类中的自定义F1评分指标

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

有人能帮我如何用python编写多类分类的F1分数？？？在 编辑：我编辑这个问题是为了更好地了解我想做什么 这是我的函数，用于5个类的多类问题的自定义评估f1分数度量。在 <pre><code>def evalerror(preds, dtrain): labels = dtrain.get_label() preds = preds.reshape(-1, 5) preds = preds.argmax(axis = 1) f_score = f1_score(preds, labels, average = 'weighted') return 'f1_score', f_score, True </code></pre> 注意：我重塑的原因是validation true值的长度为252705，而preds是长度为1263525的数组，是实际值的5倍。原因是LGB为每个预测输出每个类的probab。在 下面我将把列车和验证数据转换成LGB可以接受的格式。在 ^{pr2}$ 下面是我对培训数据进行拟合的LGB模型。如您所见，我已经将<code>evalerror</code>自定义函数传递给了位于<code>feval</code>的模型，同时还传递了验证数据<code>dvalid</code>，我想在训练时查看f1的分数。我正在训练模型进行10次迭代。在 <pre><code>evals_result = {} num_round = 10 lgb_model = lgb.train(params, dtrain, num_round, valid_sets = dvalid, feval = evalerror, evals_result = evals_result) </code></pre> 当模型接受10轮训练时，验证集上每次迭代的F1分数显示在下面，这是不正确的，因为我得到了0.18左右。在 <pre><code>[1] valid_0's multi_logloss: 1.46839 valid_0's f1_score: 0.183719 [2] valid_0's multi_logloss: 1.35684 valid_0's f1_score: 0.183842 [3] valid_0's multi_logloss: 1.26527 valid_0's f1_score: 0.183853 [4] valid_0's multi_logloss: 1.18799 valid_0's f1_score: 0.183909 [5] valid_0's multi_logloss: 1.12187 valid_0's f1_score: 0.187206 [6] valid_0's multi_logloss: 1.06452 valid_0's f1_score: 0.187503 [7] valid_0's multi_logloss: 1.01437 valid_0's f1_score: 0.187327 [8] valid_0's multi_logloss: 0.97037 valid_0's f1_score: 0.187511 [9] valid_0's multi_logloss: 0.931498 valid_0's f1_score: 0.186957 [10] valid_0's multi_logloss: 0.896877 valid_0's f1_score: 0.18751 </code></pre> 在下面的代码中，我训练了10次迭代来预测下面的代码。在 <pre><code>lgb_prediction = lgb_model.predict(valid_X) lgb_prediction = lgb_prediction.argmax(axis = 1) lgb_F1 = f1_score(lgb_prediction, valid_Y, average = 'weighted') print("The Light GBM F1 is", lgb_F1) The Light GBM F1 is 0.743250263548 </code></pre> 注意：我在这里没有像在自定义函数中那样重塑它是因为<code>lgb_model.predict()</code>输出一个numpy数组（252705，5）还要注意，我传递的是<code>valid_X</code>，而不是<code>dvalid</code>，因为在预测时，我们必须传递原始格式，而不是像我们在^{<cd7>中传递的稀疏格式 当我在同一个验证数据集上进行预测时，我得到的F1分数是0.743250263548，这已经足够好了。所以我期望的是第10次迭代时的验证F1分数应该与我训练模型后预测的相同。在 有人能帮我解决我做错的事吗。谢谢

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何用lightgbm python编写多类分类中的自定义F1评分指标

1 个回答

相关Python问题