時系列での異常検出に適したパッケージを探しています


17

時系列の異常検出に使用できる包括的なオープンソースパッケージ(できればpythonまたはR)はありますか?

scikit-learnには1つのクラスのSVMパッケージがありますが、時系列データ用ではありません。たとえば、異常検出にベイジアンネットワークを使用する、より洗練されたパッケージを探しています。


書く必要があります、仲間!! :P
Arpit Sisodia

回答:


19

私はここで少し遅れていることを知っていますが、はい、異常値の組み合わせフレームワークとともに異常検出のパッケージがあります。

まだgithubでの開発の初期段階にあり、間もなくJMLRで公開されます。

パッケージはpython言語で、パッケージの名前はpyodhttps://github.com/yzhao062/Pyod)です。

これには、以下の個別のアプローチのための複数のアルゴリズムがあります。

  1. 外れ値検出の線形モデル(PCA、vMCD、vOne-Class、およびSVM
  2. 近接ベースの外れ値検出モデル(LOF、CBLOF、HBOS、KNN、AverageKNN、およびMedianKNN
  3. 外れ値検出の確率モデル(ABODおよびFastABOD
  4. 外れ値アンサンブルと組み合わせフレームワーク(IsolationForestおよびFeatureBagging
  5. ニューラルネットワークとディープラーニングモデル(完全に接続されたニューラルネットワークを備えた自動エンコーダー

最後に、特に時系列自体を探している場合は、この githubリンクが役立ちます。

時系列異常値検出用の以下のリストパッケージがあります。

datastream.io

スカイライン

番平

異常検出


コンテキストベースの異常に取り組む方法はありますか?
Arpit Sisodia

異常検出または異常値検出について話しているのですか?違いがあります。
アーピットシソディア

6

時系列の異常を処理する方法は複数あります-

1)異常がわかっている場合は、分類モデルを作成します。このモデルを使用して、時系列データの同じタイプの異常を検出します。

2)異常が不明な場合、私たちの組織で行ったことは、クラスタリングと分類の組み合わせです。

最初に、LOF / K平均/クックの距離を使用して、外れ値を特定します。現在、外れ値と法線の2つのクラスがあるため、データ全体を分類問題に変換します。次に、分類モデルを作成し、実行時に異常を識別するためのルール(分類モデル)(時系列データ)を取得します。

3)異常が不明の場合、私の調査では、異常を特定する最も一般的な方法は、正常モデルを構築し、正常モデルからの逸脱(エラー)が異常であるため、次の1時間の時系列を予測して比較します実際の値で。エラーが予想以上の場合は、異常が発生しています。

私はpythonまたはRで直接パッケージを見つけることができませんでした。本当に異常な:Pが何であるかは誰も知らないため、すべてのケースで異常値の検出に関連しています。

いくつかの便利なリンク-

https://machinelearningstories.blogspot.com/2018/12/easiest-way-of-detection-abnormality.html

https://machinelearningstories.blogspot.com/2018/07/anomaly-detection-anomaly-detection-by.html


2

Prophet Libraryを試す

預言者は、非線形トレンドが年次、週次、日次の季節性に加えて休日の影響に適合している加法モデルに基づいて時系列データを予測するための手順です。これは、季節的な影響が強く、過去のデータのいくつかの季節がある時系列で最適に機能します。Prophetは、欠落したデータや傾向の変化に強く、通常は外れ値を適切に処理します。

詳細:Prophetライブラリを使用した時系列の異常検出

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.