信頼区間と仮説検定の違いは何ですか?


28

仮説検定に関する論争について読んだことがありますが 、一部の解説者は仮説検定を使用すべきではないと示唆しています。一部の解説者は、代わりに信頼区間を使用することを提案しています

  • 信頼区間と仮説検定の違いは何ですか?参照と例による説明をいただければ幸いです。

5
信頼区間を示すことで仮説検定結果を報告する方が、何らかのp値レベルで何かが確認または拒否されると言うよりも優れている理由をお聞きしたかったと思います。

3
答えられた他の質問のいくつかをチェックすることを検討すべきです。
アンディW

回答:


19

仮説検定に信頼区間(CI)を使用できます。典型的な場合、効果のCIが0に及ばない場合、帰無仮説を棄却できます。しかし、CIはより多くの用途に使用できますが、合格したかどうかを報告することはテストの有用性の限界です。

たとえば、t検定の代わりにCIを使用することをお勧めする理由は、仮説をテストする以上のことができるからです。可能性が高いと思われる効果の範囲(CI内の効果)について声明を出すことができます。t検定だけではそれができません。これを使用して、nullに関するステートメントを作成することもできます。これは、t検定では実行できません。t検定でnullが拒否されない場合は、nullを拒否できないと言うだけで、あまり意味がありません。しかし、nullの周囲に狭い信頼区間がある場合、nullまたはそれに近い値が本当の値である可能性が高いことを示唆し、治療または独立変数の効果が小さすぎて意味がないことを示唆できます(またはあなたの実験が

後で追加: テストのようにCIを使用することはできますが、実際にはそうではありません。これは、パラメーター値があると思われる範囲の推定値です。推論のようなテストを行うことはできますが、そのように語ることは決してしない方がはるかに良いです。

どちらが良いですか?

A)効果は0.6、t(29)= 2.8、p <0.05です。この統計的に有意な効果は...(この統計的有意性についての言及はなく、発見の大きさの実際的な意味を議論する強力な能力さえありません... Neyman-Pearsonフレームワークの下でtの大きさとp値はほとんど意味がなく、議論できるのは、効果が存在するか、存在しないかどうかだけです。実際には、テストに基づいて効果がないことについて話すことはできません。)

または

B) 95%の信頼区間を使用して、効果は0.2〜1.0であると推定します。(興味のある実際の効果についての議論が続いて、もっともらしい値が特定の意味を持つものであるかどうか、そしてそれが意味することを正確に意味する重要な単語の使用があるかどうか。さらに、CIの幅はこれが強力な発見であるかどうか、またはより暫定的な結論にしか到達できないかどうかの議論)

基本的な統計クラスを取得した場合、最初はAに引き寄せられる可能性があります。また、結果を報告するより良い方法である場合もあります。しかし、ほとんどの作業では、Bははるかに優れています。範囲の推定値はテストではありません。


@johnのコメントへの追加:最初に、重要な質問は、CIが0ではなく1にまたがるかどうかです(ロジスティック回帰など)。
ピーターフロム-モニカの復職

みんな、それは1ですか、それとも0ですか?(このルックスは非常に私が推測するので、私は外を見るために正しい値を学習する必要があり、私には照明!)@ジョン
Adheshジョシュ・

95%CIとアルファ= 0.05の両側検定仮説との関係は何ですか?彼らは同じですか?
愛の統計

love-stats、同じものを使用した場合、それらは同じです。
ジョン

Adhesh Josh、帰無仮説は事前に指定された任意の固定値です。これは、ストレートNHST上のCIのもう1つの機能です。0以外の仮想値に対してテストする場合、非常に簡単に使用できます
ジョン

7

仮説検定と信頼区間は同等です。(例:http : //en.wikipedia.org/wiki/Confidence_interval#Statistical_hypothesis_testingを参照)非常に具体的な例を挙げます。平均μと分散1の正規分布からサンプルx1,x2,,xnがあり、Nμ 1 )と書きます。μ = mと考え、レベルで帰無仮説H 0μ = mをテストするとします。μN(μ,1)μ=mH0:μ=m0.05.そこで、検定統計量を作成します。この場合、サンプルの平均値v=(x1+x2++xn)/nます。ここで、Amがこのテストのv「受け入れ領域」であると仮定します。つまり、Amは、帰無仮説 μ = mvの可能な値のセットです。μ=mレベル0.05で受け入れられます(「受け入れられた」を「拒否されない」の省略形として使用します-帰無仮説が正しいと結論付けることはお勧めしません)。この例では、Nm1正規分布を見て、この分布の下で少なくとも0.95の確率を持つ任意のセットを選択できます。ここで、μ 95%信頼領域は、vA m )にあるすべてのmの集合です。つまり、観測されたvに対して帰無仮説が受け入れられるすべてのmのセットです。ジョンが「効果のCIがスパンしない場合vAmmv0場合、帰無仮説を拒否できます。」(Johnはμ=0をテストする場合を指します)

vμmμ=m0.05。mμ=m0.0210.98


N値を拒否するテストの最小レベルとしてp値を解釈できないため、これをお読みください。「単一(または進行中)の実験でp値を解釈することは、ネイマンピアソン仮説検定のコンテキストでは許可されないことがすでに示されています。 HAをサポートする証拠の量。これは、H0に対する帰納的証拠の尺度です。」'ソース:ftp.stat.duke.edu/WorkingPapers/03-26.pdf
sree22

@ sree22これを拡張したり、言い換えを提案したりできますか?この文脈では、解釈ではなくp値の定義を与えようとしていました。
DavidR

3

「学生」は、どの効果がより重要であり、どれがより重要であるかを示すことができるという理由で、信頼区間を主張しました。

たとえば、2つ目の効果が200ポンドから2800ポンドの信頼区間を持ち、2つ目の効果が5ポンドから6ポンドの財務的影響の信頼区間を持っている場合、2つの効果が見つかりました。前者は統計的に有意ですが、後者はおそらくより重要です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.