時系列データの平均値検定の差異に使用するプールの適切なレベルに関するガイダンスが必要です。私は、このアプリケーションで緊張しているように見える、一時的および犠牲的な疑似複製について心配しています。これは、操作実験ではなく、男性の研究に関連しています。
モニタリングの演習を検討してください。センサーのシステムは、池の幅と深さ全体の多くの場所で溶存酸素(DO)含有量を測定します。DOは日によって変動することが知られているため、各センサーの測定値は1日2回記録されます。2つの値は平均され、毎日の値を記録します。週に1回、毎日の結果が空間的に集計され、池全体の1週間のDO濃度が1つになります。
それらの毎週の結果は定期的に報告され、さらに集計されます–毎週の結果は平均されて、池の月次DO濃度を与えます。毎月の結果は平均されて年間値を与えます。池の10年間のDO濃度を報告するために、年間平均自体が平均化されています。
目標は、次のような質問に答えることです。X年の池のDO濃度は、Y年の濃度と同じか、それとも高いですか、それとも同じですか。過去10年間の平均DO濃度は、過去10年間の平均DO濃度と異なりますか?池のDO濃度は、多くの大きな入力に反応するため、かなり変動します。有意性検定が必要です。方法は、平均のT検定比較を使用することです。10進値が年次値の平均であり、年次値が月次値の平均であることを考えると、これは適切なようです。
ここに質問があります–月次DO値または年次DO値から、10年平均とそれらの平均のT値を計算できます。もちろん、平均は変わりませんが、信頼区間とT値の幅は変わります。月次値を使用するとNの桁が高くなるため、そのルートを使用するとCIがかなり引き締まることがよくあります。これは、同じデータで同じ検定を使用して、平均の観察された差の統計的有意性に関して年次値を使用する場合とは逆の結論を与える可能性があります。 この矛盾の適切な解釈は何ですか?
毎月の結果を使用して、10年平均の差の検定統計量を計算する場合、一時的な疑似複製を実行していますか?年次結果を使用して10年間のテストを計算する場合、情報を犠牲にして疑似複製を行っていますか?