私は、時系列で異常値の検出を自動化しようとしています。ここでは、Rob Hyndmanによって提案されたソリューションの修正を使用しました。
たとえば、さまざまな国からのWebサイトへの毎日のアクセスを測定します。毎日の訪問が数回または数千回であるいくつかの国では、私の方法は合理的に機能しているようです。
ただし、国が1日に1回または2回しか訪問しない場合、アルゴリズムの制限は非常に狭く(1±0.001など)、2回の訪問は異常値と見なされます。どのようにしてそのようなケースを自動的に検出し、どのようにそれらを処理して異常値を特定できますか?たとえば、1日あたり100回の訪問という手動のしきい値を設定したくありません。
ありがとうございました!