Optuna示例返回测试集的评估度量是否存在缺陷？ - 问答 - Python中文网

Optuna示例返回测试集的评估度量是否存在缺陷？

2024-06-02 10:10:02 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在使用Optuna对一些模型进行参数优化

在几乎所有的示例中，目标函数都会返回测试集上的评估指标，并尝试最小化/最大化该指标。我觉得这是示例中的一个缺陷，因为Optuna会在看不见的数据上优化她的参数

对列车组cv进行优化将更加稳健。我想听听其他的想法，看看我是否遗漏了什么

谢谢

Tags：数据函数模型示例目标参数指标 cv

1条回答

网友

1楼 · 发布于 2024-06-02 10:10:02

不，这不是一个缺陷，这是一个特征。应在算法看不到的测试数据集上评估性能

如果你想交叉验证，可能需要几个月的时间来完成一个简单的Optuna研究。这样做并不是错误的，但可能是浪费时间，因为Optuna的算法是贝叶斯优化器，交叉验证只能近似

这就是说，如果您使用机器学习，并且要求每个历元都有一个训练/验证循环，我recommend使用Jun Shao的n**(0.75)比例作为您的训练集大小，在训练开始之前随机选择；它不仅更快，而且可能更好

因此，虽然在机器学习中需要进行多种培训和验证操作，但如果您使用的是Optuna，则无需交叉验证该模型的性能。请点击上面的链接，在cross validated的SE站点上查看我的答案，从那里你可以点击Githubrepo，但请先发表评论和/或查看其他人在说什么

相关问题更多 >

编程相关推荐

热门问题

热门文章