多くのゼロ値を持つ時系列の分析


19

この問題は実際には火災検知に関するものですが、いくつかの放射性崩壊検知問題に非常に類似しています。観察されている現象は散発的であり、非常に多様です。したがって、時系列は、変数値によって中断されたゼロの長い文字列で構成されます。

目的は、イベント(ゼロのブレーク)をキャプチャするだけでなく、イベント自体の定量的な特性評価です。ただし、センサーは限られているため、「現実」がゼロ以外であってもゼロを記録する場合があります。このため、センサーを比較するときにはゼロを含める必要があります。

センサーBはセンサーAよりも感度が高い可能性がありますが、統計的に説明したいと思います。この分析では、「真実」はありませんが、センサーAとBから独立したセンサーCがあります。したがって、私の期待は、A / BとCのより良い一致が「真実」とのより良い一致を示すことです。(これは不安定に思えるかもしれませんが、あなたは私を信頼する必要があります-センサーに関する他の研究から知られていることに基づいて、私はここで確固たる地位にいます)。

問題は、「時系列のより良い一致」を定量化する方法です。相関関係は明らかな選択ですが、これらすべてのゼロ(除外することはできません)の影響を受け、もちろん最大値の影響は不均衡になります。RMSEも計算できますが、ゼロに近い場合のセンサーの動作に対して強く重み付けされます。

Q1:時系列分析でゼロと結合される非ゼロ値に対数スケーリングを適用する最良の方法は何ですか?

Q2:このタイプの時系列分析に推奨できる「ベストプラクティス」は何ですか。ゼロ以外の値での動作が焦点ですが、ゼロの値が支配的であり、除外できません。

回答:


11

「アナリストは、特定のパターンに従っていない需要のない長期間にどのように対処しますか?」という質問を言い換えます。

あなたの質問に対する答えは、断続的な需要分析またはスパースデータ分析です。これは通常、非ゼロの数に対して「ゼロのロット」がある場合に発生します。問題は2つのランダム変数があることです。イベント間の時間とイベントの予想サイズ。あなたが言ったように、測定値の完全なセットの自己相関(acf)は、ゼロのシーケンスが誤ってacfを強化するため、意味がありません。データベースの手順ではなく、モデルベースの手順である「クロストンの方法」のようなスレッドを追跡できます。より厳密なアプローチは、「スパースデータ-不等間隔データ」またはそのような検索を追求することです。OSUのRamesh Sharda教授によって、かなり独創的な解決策が提案され、私はこれを長年コンサルティング業務で使用してきました。シリーズに売上が発生する時点と、売上が発生しない長期間がある場合、観測された売上を売上のない期間の数で割ることにより、売上を期間ごとの売上に変換することができます。これにより、レートと、予測レートに達する売上と予測インターバルの間隔との間のモデルを特定できます。詳細については、autobox.comおよびGoogleの「断続的な需要」をご覧ください。シリーズに売上が発生する時点と、売上が発生しない長期間がある場合、観測された売上を売上のない期間の数で割ることにより、売上を期間ごとの売上に変換することができます。これにより、レートと、予測レートに達する売上と予測インターバルの間隔との間のモデルを特定できます。詳細については、autobox.comおよびGoogleの「断続的な需要」をご覧ください。シリーズに売上が発生する時点と、売上が発生しない長期間がある場合、観測された売上を売上のない期間の数で割ることにより、売上を期間ごとの売上に変換することができます。これにより、レートと、予測レートに達する売上と予測インターバルの間隔との間のモデルを特定できます。詳細については、autobox.comおよびGoogleの「断続的な需要」をご覧ください。


1
断続的な需要の予測に問題があります。私は解決するように頼まれました。今回の予測専用のソフトウェアがいくつかあることは知っていますが、無料ではありません。この問題を解決するためのオープンソースソフトウェア(Rなど)の組み込み関数を知っている場合、教えてください。私は検索しましたが、今のところ見つけることができませんでした...ありがとう!
アッス

1
@assu:あなたのニーズを満たすフリーソフトウェアを知りません。
-IrishStat

4
@assu。R croston()forecastパッケージの関数は、断続的な需要データを予測するためのCrostonの方法を実装します。
ロブハインドマン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.