回答:
はい、信頼できる範囲の比較と、幅広い実用的な設定の仮説検定の間には、いくつかの簡単な関係があります。 ただし、CIの手順とt検定がデータに適していることを確認することに加えて、サンプルサイズに大きな違いがなく、2つのセットの標準偏差が類似していることを確認する必要があります。また、2つの信頼区間の比較から非常に正確なp値を導き出そうとするべきではありませんが、効果的な近似を作成して喜んでいるはずです。
(@Johnと@Brettによって)既に指定された2つの応答を調整しようとする場合、数学的に明示的にすることが役立ちます。この質問の設定に適した対称両側信頼区間の式は次のとおりです。
ここでサンプル平均で、独立した観察サンプル標準偏差であり、所望の試験サイズ(最大偽陽性率)とされている上部であるパーセンタイルスチューデントt分布の自由度。(この従来の表記法からのわずかな逸脱により、 vs 区別に煩わされる必要がなくなるため、説明が簡単になります。とにかく重要ではありません。)
添字用いて及びと、比較のためにデータの2つの独立したセットを区別するために二つの手段の大きい方に対応し、非信頼区間の-overlapは不等式(下側信頼限界1)で表される(上側信頼限界2 ); つまり 、
これは、対応する仮説検定のt統計のように(2つの平均を比較するために)単純な代数操作で作成することができます。
左側は、仮説検定で使用される統計です。これは通常のあるスチューデントt分布のパーセンタイルと比較されるであり、全自由度。右側は、元のt分布パーセンタイルのバイアスされた加重平均です。
これまでの分析は、@ Brettによる回答を正当化します。利用可能な単純な関係はないようです。 ただし、さらに詳しく調べてみましょう。直感的には、信頼区間が重ならないことは何かを言うべきだからです!
あれは、
この式は、次の一般的な状況で適切に機能します。
これは、一連の信頼区間を目で確認するのに十分すぎるほどです。
0.05 0.005
0.01 0.0002
0.005 0.00006
この結果は、@ Johnによる返信を正当化するものです(さらに改善されることを願っています)。したがって、以前の返信は矛盾しているように見えますが、両方とも(独自の方法で)正しいです。
いいえ、少なくとも単純なものではありません。
ただし、2つの平均の差のt検定と2つの平均の差の信頼区間との間には正確な対応関係があります。
2つの平均の差の信頼区間にゼロが含まれている場合、その差のt検定では、同じ信頼レベルでnullを棄却できません。同様に、信頼区間に0が含まれていない場合、t検定はヌルを拒否します。
これは、2つの平均それぞれの信頼区間間のオーバーラップとは異なります。
分散が等しいという典型的な仮定の下で、はい、関係があります。バーが1つのバー* sqrt(2)の長さよりも短い範囲で重なっている場合、t検定ではアルファ= 0.05で大きく異なることがわかります。バーの端がかろうじて触れている場合、差は0.01で見つかります。グループの信頼区間が等しくない場合、通常は平均を取り、同じルールを適用します。
あるいは、平均の1つの周囲の信頼区間の幅がwの場合、2つの値の最小有意差はw * sqrt(2)です。これは、独立グループt検定の分母sqrt(2 * MSE / n)、およびCIの因子sqrt(MSE / n)を考えると簡単です。
(95%CIを想定)
ここで、独立した手段の周りの信頼区間から推論を行うことに関する簡単な論文があります。この質問と、他の多くの関連する質問に答えます。
カミング、G。、&フィンチ、S。(2005年3月)。目による推論:信頼区間、およびデータの写真の読み方。アメリカの心理学者、60(2)、170-180。