仮説検定と時系列の重要性


19

2つの母集団を調べる際の通常の有意性の検定は、可能であればt検定とペアt検定です。これは、分布が正常であることを前提としています。

時系列の有意性検定を生成する同様の単純化された仮定はありますか?具体的には、2種類のかなり小さなマウスの集団が別々に処理されており、週に1回体重を測定しています。両方のグラフはスムーズに増加する関数を表示し、1つのグラフが他のグラフの上に確実に表示されます。この文脈で「明確さ」をどのように定量化するのでしょうか?

帰無仮説は、2つの母集団の重みが時間の経過とともに「同じように振る舞う」ということです。少数のパラメーターのみでかなり一般的な(正規分布が一般的であるように)単純なモデルの観点から、これをどのように定式化できますか?それを行ったら、どのように有意性またはp値に類似した何かを測定できますか?マウスをペアリングして、可能な限り多くの特性を一致させ、各ペアが2つの母集団のそれぞれから1つの代表を持っている場合はどうでしょうか?

時系列についての、よく書かれたわかりやすい本や記事へのポインターを歓迎します。私は無知から始めます。ご協力いただきありがとうございます。

デビッド・エプスタイン


これは必ずしも時系列の問題ではないため、より広範なネットをキャストすることをお勧めします。確かに、おそらくここで最も基本的な質問は、治療の「エンドポイント」を定量化する最良の方法または少なくとも正しい方法に関するものです。それは、特定の時間後の人口の増加、経時的な平均成長率などを意味しますか?実験を開始する前にこれを知らず、成長曲線の一貫した違いに突然気付いた場合、確認モードではなく探索モードで作業しており、仮説検定のp値は一見良好です。
whuber

結果は予想通り定性的であり、一方的なテストが適切であると思われます。時系列について質問した理由は、最終的な重量のみを測定する場合(最も関連性の高い測定値)、それ以前の時点からのすべての情報を捨ててしまい、間違っているように見えるためです。
デビッドエプスタイン

そのとおりです。これらのデータを破棄したくありません。しかし、理想的な曲線からの偏差の時間的相関が重要であるデータのモデルでは、時系列手法が前面に出ます。あなたの状況は、これらのケースのいずれにも該当しそうにありません。よりシンプルで、科学的に意味のある方法が利用可能です。
whuber

@whuber、マウスのコントロールセットの経時的な重量は、ある意味で「理想的な曲線」ではありませんか。または、少なくとも、そのデータに適合した理論モデルですか?
naught101

1
はい、@ naught、それはそれを見る合理的な方法です。しかし、「曲線」は「時系列」と同じではありません。たとえば、線形回帰はデータへの適合曲線と見なすことができます(多くの場合)が、データと理想曲線間の偏差間の相関関係の構造を強調する時系列分析とは異なります。
whuber

回答:


1

体重の変動を動的なプロセスと考える場合は、多くの方法があります。

たとえば、積分器としてモデル化できます x˙(t)=θx(t)+v(t)

ここで、は重みの変化、は重みの変化の速さに関係し、は重みの変化に影響する可能性のある確率的外乱です。既知のに対してをとしてモデル化できます(推定することもできます)。x(t)θv(t)v(t)N(0,Q)Q

ここから、たとえば予測誤差法を使用して、2つの母集団(およびそれらの共分散)のパラメーターを特定することができます。ガウス仮定が成り立つ場合には、予測誤差法は、の推定値ということ与えるまた、(漸近的に)ガウスであり、あなたがそれゆえ決定するためにテストする仮説を構築することができますの推定値かどうか統計的に近いとされる。θθθ1θ2

参考のために、このを提案できます。


0

各マウスのARIMAモデルを個別に識別し、類似性と一般化について確認することをお勧めします。たとえば、最初のマウスにAR(1)があり、2番目のマウスにAR(2)がある場合、最も一般的な(最大の)モデルはAR(2)になります。このモデルをグローバルに、つまり結合された時系列に対して推定します。結合されたセットの誤差二乗和を2つの個別の誤差二乗和の合計と比較して、F値を生成し、グループ全体で定数パラメーターの仮説をテストします。データを投稿できることを望みます。このテストを正確に説明します。

追加コメント:

データセットは自動相関であるため、正規性は適用されません。観測値が経時的に独立している場合、よく知られている非時系列法のいくつかを適用できます。時系列に関する読みやすい本についてのあなたのリクエストに関して、Addison-WesleyによるWeiのテキストをお勧めします。社会科学者は、MclearyとHay(1980)の非数学的なアプローチがより直感的であるが厳密さが欠けていることに気付くでしょう。


1
これは、根本的な問題に対処しているようには見えません。(1)なぜこのようなモデルが適切なのですか?(2)なぜ各マウスをモデル化する必要があり、たとえば、平均母集団の体重や体重の増加ではないのか?(3)定数パラメーターのテストが関連するのはなぜですか?質問は片側検定を求めています。あなたが言及するパラメーターのほとんどは、科学的に関連しているようには見えず、また、あるグラフが他のグラフより一貫して上にあるという感覚を直接定量化するものでもありません。(4)実験の開始時に、2つの母集団の特性の違いをどのように制御しますか?
whuber

:whuberパラメーター1の最初のグループの係数と2番目のマウスの係数の2番目のセットの係数のセットがあるため、パラメーターの不変性のテストは関連しています。質問は、「係数間に集合的な有意差があります」モデル係数の1つが定数であり、それが係数である場合、係数が互いに統計的に異なるため、係数間の差が生じる可能性があるため、基礎となるARIMAモデルは必ずしも差モデルであるため定数を持たない場合があることに注意
IrishStat

1
部分的には正しいと思いますが、問題の特性を改善する必要があります。ARIMA係数の多くは科学的に無関係かもしれません。たとえば、そのうちの1つが時間の経過とともに2次項のように動作する場合、違いは成長曲線の形状について何かを言うかもしれませんが、それはほとんど役に立たない可能性があります。実験的エンドポイントを反映する係数を選択し、それらのみをテストする場合、それによっていくつかの良い結果が得られる可能性があります。ただし、一般に、時系列モデルでは、ここで直接科学的に関心のあるとは考えられない係数(自己相関など)が導入されます。
whuber

whuber:「実験のエンドポイントを反映する係数を選択し、それだけをテストする場合、それによっていくつかの良い結果が得られる可能性があります」は、中間点を無視するため、あまり意味がありません。あなたのコメントとは反対に、時系列モードとそれに付随する係数は、読み取り値の分布を特徴付け、自己相関構造のないランダムなプロセス(エラー項)に変換するため、科学的に重要です正常性が必要です。私が提案するテストでは、その仮定を保持する必要があります。
IrishStat

1
ここでは自己相関はほとんど重要ではありません。関心は明確にトレンドに焦点を合わせています。基礎となる成長曲線は、2つの集団間でどのように異なる傾向がありますか?自己相関パラメーターは迷惑パラメーターであり、これらの成長曲線の推定を改善するのに役立つ可能性がある場合にのみ導入され、対処されます。最初の優先事項は、成長の科学モデルを採用し、解釈可能で興味のあるパラメーターでそのモデルを表現し、それらを推定することです。 時系列技術の自動適用がそれを達成する可能性は低いです。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.