要预测罕见事件分类,有没有比使用LSTM Keras“更简单”的方法?

2024-09-30 05:29:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在研究稀有事件预测,这是我以前从未做过的(我曾经处理过简单的预测问题),我查阅了关于使用LSTM进行时间序列稀有事件分类的this article。在

读起来很激动,因为我觉得我的案例有点类似:用历史活动特征预测奶牛产犊时间,在数据采集的最后只发生一次产犊。在

但是。。。除了我的数据比这个例子小得多之外,我在使用LSTM时有太多的混乱。关于LSTM,我期待的一个优点是“回溯”特性,它可以让您决定每个输出在上一次回溯时有多少输入。在

我的问题是:有没有一种“更简单”或更简单的机器学习方法可以像LSTM一样用于时间序列分类?在

我试图使用简单的ML,如决策树、随机森林,但我认为它不能很好地代表问题(将许多历史数据放入一个输出中)。在

这个问题也在StackExchange上交叉发布。我知道我应该在这里问更多与编程相关的问题,但任何帮助/见解都将不胜感激。在


Tags: 数据article时间事件分类序列特征历史
1条回答
网友
1楼 · 发布于 2024-09-30 05:29:53

许多机器学习项目/程序的问题是缺少数据,这是您不希望使用LSTM的原因之一。不仅对于LSTM(尽管这些方法也会受到很大的影响),而且其他方法也会遇到一些问题,例如过度拟合数据、对异常值的重视程度更高等等,这些问题实际上只能通过更多的数据(或对参数进行微调)来解决。在

您可以考虑的一个选项是合成数据生成,或者使用不同的方法来增长数据集。这样,您仍然可以使用LSTM,因为它将有更多的数据可以运行。在

我将链接到一个article,我发现它有助于解决小数据的问题。最好的办法是使用简单的,或者更基本的ML方法(线性回归就是一个例子)。在

如果你想尝试将罕见的预测从更标准的模式中分离出来,你可以尝试使用支持向量机(对你的数据集知之甚少,很难说)。在

如果你想找出方差,即罕见的预测,你也可以尝试使用主成分分析,看看最大的方差在哪里。在

同样,我建议的方法很大程度上取决于您的数据集,我不确定它们对您的时间序列数据的有效性。找到一种扩大数据集的方法将是更好的选择。在

告诉我这是否有用!在

相关问题 更多 >

    热门问题