時系列に最適な統計検定は何ですか?


16

一定の間隔でデータセットごとに5〜10個のデータポイントを持つ単純な時系列があります。2つのデータセットが異なるかどうかを判断する最善の方法は何だろうと思っています。各データポイントでt検定を試す必要がありますか、それとも曲線の下の領域を見る必要がありますか、それともより効果的な多変量モデルがありますか?


「異なる」とはどういう意味ですか?
シェーン

データセットあたり 5〜10個のデータポイント」とはどういう意味ですか?
S. Kolassa -復活モニカ

彼はいくつかの時系列のコレクションを持っていると思います。各時系列には5〜10個の観測があります。
ロブハインドマン

私はまだ...この質問は、どのような「異なる」手段を理解せずに答えることはほぼ不可能であることを考える
シェーン

言葉遣いの乏しい質問に対する私の謝辞。異なることとは、時系列の過程で(個々のポイントではなく)2つの治療グループに違いがあるかどうかを意味します。被験者間変動(これは説明する必要があると思います)とグループ間変動(これは私が興味を持っていることです)があります。
デイブ

回答:


11

「異なる」という意味を正確に指定する必要があります。また、各時系列内のシリアル相関構造についてどのような前提を作成するかを指定する必要があります。

t検定で、各グループの平均を比較し、グループは分散が等しい独立した観測で構成されると仮定しています(後者は緩和される場合があります)。時系列をテストする場合、通常、独立性の仮定は合理的ではありませんが、それを指定された相関構造に置き換える必要があります。したがって、2つ以上の時系列の平均を比較することでさえ、独立したデータを使用する場合よりもかなり困難です。

各時系列についてどのような仮定をするのか、比較したいのかを慎重に指定し、(想定モデルに基づいて)パラメトリックブートストラップを使用してテストを実行します。


6

たぶん、anovaが必要なものを繰り返し測定します。被験者(被験者内要因)ごとに「時系列」の相関構造を取りながら、被験者(被験者間要因)を比較できます。これは簡単ですが、時代遅れの方法であり、「一般線形モデル」のコンテキストで見つけることができ、いくつかの追加機能(球形度など)が必要です。別の方法は、より一般的な相関構造(ロブのようなAR(1)でさえも)と不均衡なデータを可能にする混合線形モデルです。


2

単純な線形トレンドを仮定する場合は、さまざまな時点での各データセットの差を取り、線の勾配がゼロであることをテストできます。

-ラルフ・ウィンターズ

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.