Python中文
首页
教程
问答
标签
搜索
登录
注册
不平衡类上的pythonxgboost
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我目前正在进行一个机器学习项目,目的是预测一个二进制类(负:0,正:1)。数据集不平衡。阳性率为0.1%。在</p> <p>我正在运行一个xgboost模型,以gini作为性能指标。 问题是在boosting迭代过程中,它需要大量的运行来提高分数</p> <p>示例:</p> <pre><code>[Fold 1/2] [0] train-gini:-0.048192 validation-gini:-0.042979 Multiple eval metrics have been passed: 'validation-gini' will be used for early stopping. Will train until validation-gini hasn't improved in 200 rounds. [10] train-gini:-0.048192 validation-gini:-0.042979 [20] train-gini:-0.048192 validation-gini:-0.042979 [30] train-gini:-0.048192 validation-gini:-0.042979 [40] train-gini:-0.048192 validation-gini:-0.042979 [50] train-gini:-0.048192 validation-gini:-0.042979 [60] train-gini:-0.048192 validation-gini:-0.042979 [70] train-gini:-0.048192 validation-gini:-0.042979 [80] train-gini:-0.048192 validation-gini:-0.042979 [90] train-gini:0.197521 validation-gini:0.114222 [100] train-gini:0.247692 validation-gini:0.150601 [110] train-gini:0.2742 validation-gini:0.169023 [120] train-gini:0.278983 validation-gini:0.168095 [130] train-gini:0.316636 validation-gini:0.19118 [140] train-gini:0.347296 validation-gini:0.191045 [150] train-gini:0.368581 validation-gini:0.20094 [160] train-gini:0.374773 validation-gini:0.20906 [170] train-gini:0.398815 validation-gini:0.215193 [180] train-gini:0.426088 validation-gini:0.220467 [190] train-gini:0.439271 validation-gini:0.22249 [200] train-gini:0.455897 validation-gini:0.226621 [210] train-gini:0.469989 validation-gini:0.229512 [220] train-gini:0.485784 validation-gini:0.233432 [230] train-gini:0.496734 validation-gini:0.23747 [240] train-gini:0.503718 validation-gini:0.241804 [250] train-gini:0.51102 validation-gini:0.241841 [260] train-gini:0.523444 validation-gini:0.244312 [270] train-gini:0.530968 validation-gini:0.245467 [280] train-gini:0.538703 validation-gini:0.247433 [290] train-gini:0.546911 validation-gini:0.244196 [300] train-gini:0.553623 validation-gini:0.244161 [310] train-gini:0.561385 validation-gini:0.245099 [320] train-gini:0.571532 validation-gini:0.244787 [330] train-gini:0.578088 validation-gini:0.246146 [340] train-gini:0.585054 validation-gini:0.245624 [350] train-gini:0.591924 validation-gini:0.245463 [360] train-gini:0.596331 validation-gini:0.247517 [370] train-gini:0.600661 validation-gini:0.249465 [380] train-gini:0.606264 validation-gini:0.249034 [390] train-gini:0.611768 validation-gini:0.249182 [400] train-gini:0.617176 validation-gini:0.248239 [410] train-gini:0.621629 validation-gini:0.249248 [420] train-gini:0.626766 validation-gini:0.24975 [430] train-gini:0.631587 validation-gini:0.247824 [440] train-gini:0.636737 validation-gini:0.246586 [450] train-gini:0.641735 validation-gini:0.246552 [460] train-gini:0.649765 validation-gini:0.246332 [470] train-gini:0.654319 validation-gini:0.243546 [480] train-gini:0.659301 validation-gini:0.241965 [490] train-gini:0.665632 validation-gini:0.242562 [500] train-gini:0.669333 validation-gini:0.241306 [510] train-gini:0.673625 validation-gini:0.240314 [520] train-gini:0.678935 validation-gini:0.239846 [530] train-gini:0.683851 validation-gini:0.240029 [540] train-gini:0.685694 validation-gini:0.240691 [550] train-gini:0.689285 validation-gini:0.239974 [560] train-gini:0.691698 validation-gini:0.239079 [570] train-gini:0.694017 validation-gini:0.239407 Stopping. Best iteration: [373] train-gini:0.60227 validation-gini:0.24996 </code></pre> <p>我们可以看到,在第80轮,火车和验证的分数最终得到提高。这种情况会重复,即使我改变分裂的种子(但是分数增加的回合的n°将改变)。在</p> <p>有人遇到过这种问题吗?在</p> <p>干杯, 阿斯特鲁斯</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>没有。但是如果只有0.1%的正值,您可能需要尝试xgboost参数的<code>scale_pos_weight : float</code>值</p> <p>也许它能解决这个问题。我会选择:</p> <pre><code>scale_pos_weight = 1000 </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
4 回答
为什么在使用strptim时会出现这个datetime日期错误
9 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
7 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
1 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
1 回答
为什么在使用tabla时会得到一个空的数据帧?
9 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
7 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
6 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
5 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
2 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
6 回答
为什么在使用TextBlob时会出现HTTP错误?
2 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
5 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
5 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
9 回答
为什么在使用tkinter时不能使用复选框?
5 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
1 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
2 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
3 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
9 回答