カウントデータの非季節化


12

Rでstl()を使用して、カウントデータをトレンド、季節、不規則なコンポーネントに分解しました。結果のトレンド値は、もはや整数ではありません。次の質問があります。

  1. stl()はカウントデータを非季節化する適切な方法ですか?
  2. 結果のトレンドはもはや整数値ではないため、lm()を使用してトレンドコンポーネントをモデル化できますか?

回答:


8

stl()を使用してカウントデータを非季節化することに固有の問題はありません。ただし、注意すべき問題の 1つは、一般に、平均値が増加するにつれてカウントデータの分散が増加することです。これは、分解の季節的要素とランダム要素の両方でよく見られます。生データでstl()を使用してもこれは考慮されないため、最初にデータの対数(編集-または平方根)を取得するのが最善です。

トレンド値が整数ではなくなっても問題ありません。ポアソン分布のパラメーターと同様の方法で考えることができます。ポアソン分布変数は整数でなければなりませんが、平均はそうである必要はありません。

ただし、必ずしもlm()を使用してトレンドコンポーネントをモデル化できるわけではありません。スプリアス相関を回避するのは非常に困難であるため、時系列のトレンドのモデリングには多くの落とし穴があります。より一般的には、人々は最初にシリーズの傾向を調べてから、残余部分をモデル化します。


1
収容する必要があるトレンドの数と、各トレンドの長さをどのように決定しますか?レベルシフトとトレンドを区別しますか?一般的に、外れ値/インライアの存在下でトレンドをどのように減少させますか?
IrishStat

@IrishStat-はい、それらはすべて良い点であり、問​​題の完全なセットに対処しようとしていませんでした、Rのstl()の出力からのトレンドコンポーネントを回帰の応答変数として使用する問題に注意を向けるだけでした。stl()は、その分解に局所的に重み付けされた回帰を使用します。これは、一般に、特に予測のためのモデルベースの方法と比較して制限がありますが、方向を変える傾向などに関しては、一般に理にかなった結果をもたらします。
ピーターエリス
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.