哪种算法适合我的时间序列数据?

2024-06-28 11:39:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我在监控团队工作,我们会监控我们的客户端负载在我们的工具上。 我们分别用时间序列记录了延迟。在

最初,我保持一个静态阈值来提高异常检测。然而,如果季节性发生,它就不起作用了。我正在申请我的数据。在

我的数据看起来像:

enter image description here

volume_nfs_ops   timestamp           mount_point
---------------------------------------------------------
2103             6/28/2018 3:16      /slowfs/us01dwt2p311
12440            6/28/2018 6:03      /slowfs/us01dwt2p311
14501            6/28/2018 14:20     /slowfs/us01dwt2p311
12482            6/28/2018 14:45     /slowfs/us01dwt2p311
10420            6/28/2018 18:09     /slowfs/us01dwt2p311
7203             6/28/2018 18:34     /slowfs/us01dwt2p311
14104            6/28/2018 21:58     /slowfs/us01dwt2p311
6996             6/29/2018 7:35      /slowfs/us01dwt2p311
11282            6/29/2018 8:39      /slowfs/us01dwt2p311

当我做google时,我发现ARIMA是时间序列的最佳模型。我对数学很在行,可以考虑各自的ARIMA是否适合我的数据集。在

我的问题是哪种算法最好用Python实现? 我应该考虑哪些因素来发现异常?在


Tags: 工具数据客户端记录时间静态序列阈值
1条回答
网友
1楼 · 发布于 2024-06-28 11:39:26

异常检测技术有很多种。即使要检测时间序列数据中的异常,也不需要进行时间序列预测算法很少方法-

A)如果已知异常,使用分类算法。在你的情况下可能是异常的阈值?-在

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html

B)如果在数据。那么你需要使用无监督的异常检测算法。K均值、LOF、CBF、PCA、角度等

C)无监督的算法(聚类的离群值)从不给出异常值,而是这些异常值,因此如果您觉得异常值代表异常,则使用这些基于聚类(B)的异常检测算法。在

4)异常检测和时间序列是专业领域。别搞糊涂了。我可以分享一些文件,如果你认为你正在寻找无监督的异常检测算法。在

相关问题 更多 >