これはSPSSのt検定に関する質問です。
2つのグループがあり、2つの平均が等しいかどうかをテストしたいと思います。ブートストラップでt検定を使用しています。最終的に、p値<0.005が得られました。これにより、2つの母集団の平均は等しいという帰無仮説が却下されますが、私の場合、ゼロは1000サンプルに基づく95%BCaブートストラップ信頼区間内にあります。 。
平等な平均の仮説はまだ却下されますか?
これはSPSSのt検定に関する質問です。
2つのグループがあり、2つの平均が等しいかどうかをテストしたいと思います。ブートストラップでt検定を使用しています。最終的に、p値<0.005が得られました。これにより、2つの母集団の平均は等しいという帰無仮説が却下されますが、私の場合、ゼロは1000サンプルに基づく95%BCaブートストラップ信頼区間内にあります。 。
平等な平均の仮説はまだ却下されますか?
回答:
警告: この回答は、質問がブートストラップp値とCIの解釈に関するものであることを前提としています。従来のp値(ブートストラップされていない)とブートストラップCIの比較は、別の問題になります。
従来の(ブートストラップされていない)t検定では、95%CIと有意性の.05カットオフに対するp値の位置は常に同じことを教えてくれます。これは、どちらも同じ情報に基づいているためです。自由度のt分布と、サンプルで観察された平均誤差と標準誤差(または、2標本のtの場合は、平均と標準誤差の差)テスト)。CIが0と重複しない場合、p値は必ず<.05になります---もちろん、ソフトウェアのバグや、テストの実装または解釈にユーザーエラーがない限り。
ブートストラップされたt検定では、CIとp値は両方とも、ブートストラップによって生成された経験的分布から直接計算されます。p値は、ブートストラップされたグループの差のうち、元の観測された差よりも極端に大きいパーセントです。95%CIは、ブートストラップされたグループの差の中間の95%です。p値とCIがブートストラップ検定での有意性について意見を異にすることは不可能ではありません。
ブートストラップテストのコンテキストでは、p値(CIと比較して)は仮説テストの精神をより直接的に反映するため、その値に基づいてnullを拒否するかどうかを決定することが最も理にかなっています。希望するアルファ(通常は.05)。したがって、あなたのケースでは、p値は.05未満ですが、95%CIにはゼロが含まれているため、帰無仮説を拒否することをお勧めします。
これらはすべて、「有意性」が実際にどの程度重要であるか、および帰無仮説の有意性検定が実際にツールにとってそれほど有用であるかどうかについての大きなアイデアをスキップします。簡単に言えば、私は常に有意性検定分析を効果サイズの推定で補完することをお勧めします(2サンプルのt検定の場合、最良の効果サイズ推定はおそらくコーエンのdになります)。これは、結果の理解に役立ついくつかの追加のコンテキストを提供します。
関連する役立つ記事:ブートストラップされたリサンプルから取得した信頼区間の意味は何ですか?
帰無仮説のp値が0.05より小さい場合、帰無仮説でゼロであると想定しているパラメーターの0.05の信頼区間にゼロを含めないでください。これは同じことです。したがって、バグがあるか、同じ仮説をテストしません。
編集、他の回答と以下のコメントが正しく示しているように、これは完全な話ではありません。ただし、グループの平均が異なる(p <0.005)ことを示し、他のテストが棄却しない(p> 0.05)ことを1つのテストが示している場合、おそらくテストは実際に異なることをチェックしていると思います。
理論的には、この違いは無症候性が原因である可能性がありますが(ブートストラップは有限サンプルの近似ですが、他のテストは正規性の仮定に基づく近似です)、その違いは驚くほど大きいです。それは驚くほど大きいと私は主張します、そしてそれで何が起こっているかを理解することなしに、あなたはまだ結論を出すべきではありません。ちなみに、ここに質問を投稿することで、それもまさにあなたがやっていることです。多分あなたは数字を共有して、この興味深い質問をもう少し具体的にすることができます。