一定の間隔でデータセットごとに5〜10個のデータポイントを持つ単純な時系列があります。2つのデータセットが異なるかどうかを判断する最善の方法は何だろうと思っています。各データポイントでt検定を試す必要がありますか、それとも曲線の下の領域を見る必要がありますか、それともより効果的な多変量モデルがありますか?
一定の間隔でデータセットごとに5〜10個のデータポイントを持つ単純な時系列があります。2つのデータセットが異なるかどうかを判断する最善の方法は何だろうと思っています。各データポイントでt検定を試す必要がありますか、それとも曲線の下の領域を見る必要がありますか、それともより効果的な多変量モデルがありますか?
回答:
「異なる」という意味を正確に指定する必要があります。また、各時系列内のシリアル相関構造についてどのような前提を作成するかを指定する必要があります。
t検定では、各グループの平均を比較し、グループは分散が等しい独立した観測で構成されると仮定しています(後者は緩和される場合があります)。時系列をテストする場合、通常、独立性の仮定は合理的ではありませんが、それを指定された相関構造に置き換える必要があります。したがって、2つ以上の時系列の平均を比較することでさえ、独立したデータを使用する場合よりもかなり困難です。
各時系列についてどのような仮定をするのか、比較したいのかを慎重に指定し、(想定モデルに基づいて)パラメトリックブートストラップを使用してテストを実行します。
単純な線形トレンドを仮定する場合は、さまざまな時点での各データセットの差を取り、線の勾配がゼロであることをテストできます。
-ラルフ・ウィンターズ