我关于ML模型的方法正确吗？数据科学堆栈交换

1条回答

网友

1楼 · 发布于 2024-10-06 12:30:27

免责声明：请记住，我不是这类应用的专家

How could I be sure this is not caused by the training error?

您可以确定，因为评估过程是有效的。在任何ML过程中都会出现错误，重要的是正确估计错误的预期水平（性能评估）

据我所知，您当前的方法是正确的，因为您的评估设置似乎有效：测试集由实际飞行数据组成。只要评估是可靠的，模型的训练方式就无关紧要。事实上，该模型甚至可以是一个没有训练数据的简单启发式模型：它的性能可能不会很好，但就方法论而言，重要的是性能得到了正确的估计

我不确定我是否遵循了你为清理训练数据所做的过程。重要的是，它不应依赖于您用作测试集的实际飞行数据，因为这会导致数据泄漏。只要不需要，就可以按任何方式预处理数据集。但是要小心，如果您计划尝试对训练数据使用许多不同的选项并对每个选项进行评估，那么您应该使用与最终测试集不同的验证集（此过程类似于参数调整）

您可以考虑在训练过程中使用实际飞行数据的一小部分作为验证集（我假设您当前使用一些模拟数据正确吗？）。同样，如果您这样做，请确保使用完全独立的子集作为测试集

相关问题更多 >

编程相关推荐

热门问题

热门文章

我关于ML模型的方法正确吗？数据科学堆栈交换

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >