95%の信頼区間内のすべての値が等しく発生する可能性はありますか?


56

平均値の差または比率の差の95%信頼区間(CI)を構築する場合、CI内のすべての値は等しく発生する可能性がありますか?または、ポイント推定値が最も発生する可能性があります、CIの「テール」に近い値はCIの中央にある値よりも少ない可能性がありますか?

たとえば、特定の治療による死亡の相対リスクが1.06(95%CI 0.96から1.18)であるとランダム化臨床試験レポートに記載されている場合、0.96が正しい値である可能性は1.06と同じですか?

この概念に関する多くの参照がオンラインで見つかりましたが、次の2つの例はその中の不確実性を反映しています。

  1. 信頼区間に関する Lisa Sullivanのモジュールの状態:

    平均の差の信頼区間は、(μ1μ2)の可能性のある値の範囲を提供します。信頼区間のすべての値は、(μ1μ2)の真の値の推定値である可能性が等しいことに注意することが重要です。

  2. エラーの範囲内」というタイトルのこのブログ投稿は次のように述べています。

    私が念頭に置いているのは、中央限界定理がt分布ではなく有界均一分布を暗示しているかのように、信頼区間内のすべての点を同等に扱う「誤差範囲」についての誤解です。[...]
    「エラーのマージン」ミスについて話すことは、ポイント推定値に近い可能性が、マージンの端にある可能性よりもはるかに高いということです。

これらは矛盾しているように見えるので、どちらが正しいですか?


7
混乱は、p値が均一に帰無仮説の下で配布されている関連する概念でどこかに存在する場合、私は疑問に思う...
マイケル・マッゴーワン

4
最初の引用は、信頼区間のその他の点では正確な説明における異常なスリップです。2番目の引用は、わかりやすく言うと、ずさんな混乱であるという説明です。あいまいな記述、不正確な記述、またはベイジアン的な意味でしか解釈できない記述でいっぱいです。しかし、両方の引用は間違っています!
whuberの

@whuber 2番目のものを混乱とは呼びません...私はそれを頻度論的解釈のベイジアン解釈と呼びます:)
マイケルマッゴーワン

1
@Michaelずさんな例の1つは、CLTが「[母集団]平均の無限の反復推定値は依然として正規分布に従う」と暗示するような独裁主義です。単純に非技術的な聴衆にアイデアを伝えるために、間違っている必要はありません。
whuber

2
@whuber、あなたが引用した文は小さな罪だと思います。主なエラーは、CLTがt分布を含まないことです。
グラッシー

回答:


23

答える必要がある1つの質問は、この文脈で「可能性が高い」とはどういう意味ですか?

確率を意味する場合(シノニムとして使用されることもある)、厳密な周波数定義を使用している場合、真のパラメーター値は変化しない単一の値であるため、その点の確率(尤度)は100%であり、すべて他の値は0%です。そのため、ほぼすべてが0%に等しくなる可能性がありますが、間隔に真の値が含まれている場合は、他の値とは異なります。

ベイズのアプローチを使用する場合、CI(信頼区間)は事後分布から得られ、区間内の異なるポイントで尤度を比較できます。区間内で事後が完全に均一でない限り(理論的には可能ですが、それは奇妙な状況でしょう)、値の尤度は異なります。

信頼度に似ている可能性が高い場合は、次のように考えます。95%の信頼区間、90%の信頼区間、85%の信頼区間を計算します。真の値は95%の区間の内側であるが、90%の区間の外側の領域にあると5%確信しています。つまり、真の値は5%でその領域に入る可能性が高いと言えます。同じことは、90%の間隔の内側にあるが85%の間隔の外側にある領域にも当てはまります。したがって、すべての値が等しくなる可能性がある場合、上記の2つの領域のサイズはまったく同じである必要があり、10%信頼区間内で5%信頼区間外の領域についても同じことが当てはまります。間隔を使用して構築される標準分布には、このプロパティがありません(ユニフォームから1引きする特別な場合を除く)。

既知の母集団からの多数のデータセットをシミュレートし、関心のある信頼区間を計算し、真のパラメーターが各エンドポイントよりもポイント推定値に近い頻度を比較することで、これをさらに証明できます。


3
可能性は、この質問が答えで必要とするものであり、頻度ではなく、ベイジアンの確率です。可能性はまさにその答えを提供しますが、他の人はねじれやストレッチを行うことによってのみそうすることができます。
マイケルルー

1
@グレッグあなたの説明が好きです。明確にするために、あなたの議論は、95%CIの「テール」の値が、ポイント推定に近い値よりも少ない(可能性が低い)という概念をサポートしています。御返答いただき有難うございます。
pmgjones

1
@pmgjonesの可能性は低い、いいえ、2番目の段落を参照してください。4番目の段落の文脈ではそうではありません、はい。
グレッグスノー

2
@GregSnow 2番目の段落では、真のパラメーターが真のパラメーターである確率は100%であるとほぼ正確に述べています。このトートロジーが「厳格な頻度主義者の定義」が提供するものであると本当に信じていますか?
rolando2

2
@ rolando2、私は頻繁な統計が提供する多くのことを持っていると思います、私は真の値の変化を意味する一般的な虚偽表示を排除していましたセンター)。その後の段落では、アイデアに対するより本当の感触を得ます。
グレッグスノー

19

これは素晴らしい質問です!問題を理解するのに役立つ可能性と呼ばれる数学的概念があります。フィッシャーは尤度を発明しましたが、確率よりもやや望ましくないと考えましたが、尤度は確率よりも「原始的」であることが判明し、Ian Hacking(1965)はそれが証明可能でないという点で公理的であると考えました。可能性は、逆ではなく確率を支えます。

ハッキング、1965 。統計的推論の論理

尤度には、統計の標準的な教科書に記載すべき注意事項はありませんが、正当な理由はありません。予想されるプロパティをほぼ正確に持つという点で確率とは異なり、尤度関数と間隔は推論に非常に役立ちます。おそらく、関連する尤度関数を導出する「適切な」方法がないため、一部の統計学者は尤度を好まないでしょう。ただし、多くの場合、尤度関数は明白であり、明確に定義されています。推論の可能性の研究は、おそらくRichard Royallの統計的証拠:尤度パラダイムと呼ばれる小さくてわかりやすい本から始めるべきです。

あなたの質問への答えは、いいえ、どの区間内のポイントもすべて同じ可能性を持っているわけではないということです。通常、信頼区間の端にあるものは、区間の中心に向かって他よりも尤度が低くなります。もちろん、従来の信頼区間では、特定の実験に関連するパラメーターについては何も直接わかりません。ネイマンの信頼区間は、手持ちの実験に関連する「ローカル」特性ではなく、長期的な特性を持つように設計されているという点で「グローバル」です。(幸いなことに、長期的なパフォーマンスはローカルで解釈できますが、それは数学的現実ではなく知的な近道です)。


1
@suncoolsu問題の間隔は、ステートメントが真である可能性のある間隔である必要はありません。間隔の境界がそれぞれ間隔内のポイントよりも低い可能性があるように、間隔は最も可能性の高い推定値に及ぶ必要があります。通常の信頼区間はいずれもその要件を満たします。
マイケルルー

2
@pmjones 95%CIは、CIのマージンに向かって値が真ん中の値よりも真実に近いかどうかを教えてはいけません。CIは、母集団からの繰り返しサンプリングに関するステートメントを作成します。長い目で見れば(つまり、サンプリングを繰り返した後)、各サンプルに対して作成されるこのようなCIの95%が真の値をカバーします。したがって、2つの重要な観察結果があります。1)特定のCIの真の値については何も言えません。2)CIは観察されたデータについては何も伝えません。
suncoolsu

1
@MichaelLew Likelihoodの原則は有用ですが、私は(LWを引用して)「実際、すべての頻度論的推論はLPに違反するので、LPに固執する場合、頻度論的推論を放棄しなければならない」と言っていました。CIは頻繁なアイデアであるため、LPに違反しています(これは基本的なことです)。
suncoolsu

1
@suncollsu問題は、信頼区間だけで、他の統計的な考慮事項ない場合、それ自体のパラメーター値の尤度について何かを伝えるかどうかではありません。間隔内のパラメーター値の可能性についてです。尤度関数は質問に回答し、信頼区間が尤度の原則に違反していても、その回答は正しいです。(以前のコメントをもう一度お読みください。その内容を完全に無視しているようです。)
マイケルルー

2
@ rolando2 Neymanの95%信頼区間は、メソッドが使用される機会の95%でメソッドに真のパラメーターが含まれるように設計されています。厳密に言えば、信頼は個々の区間ではなくメソッドに付随するため、個々の区間はその特定の実験の世界の状態について何も伝えません。詳細については、この質問に対する私の答えを参照してください。stats.stackexchange.com/questions/8844/...
マイケル・ルー

18

人口値の潜在的な指標として、CI95内のすべての値に平等に信頼するべきだと誰かが私に言ったとします。(意図的に「可能性が高い」および「可能性がある」という用語を避けています。)95の特別な点は何ですか?なし:一貫性を保つために、CI96、CI97、...、およびCI99.9999999内のすべての値にも同等の信頼を置く必要があります。CIのカバレッジが限界に近づくと、実質的にすべての実数を含める必要があります。この結論のばかばかしさから、最初の主張を拒否することになります。


4
これは素晴らしい答えです!極端なCIに近づいた場合の影響について考えるべきでした。これを書いてくれてありがとう!
pmgjones

2

信頼区間の定義から始めましょう。95%の信頼区間がこれからそこに行くと言うと、その性質のステートメントは約95%の時間に真であり、約5%の時間に偽であるということです。私は必ずしもこの特定の声明について95%の自信があるとは限りませ。90%の信頼区間は狭くなり、80%はさらに狭くなります。したがって、真の値が何であるかを疑問に思うとき、特定の信頼区間の端に近づくにつれて値の信頼性が低くなります。

上記はすべて定性的であり、特に「信ence性」に注意してください。(私たちの直感的な手荷物とは異なる可能性のある数学的手荷物を運ぶので、その文では「自信」または「可能性」という用語を避けました。)ここでワームのことができます。

Box、Hunter&Hunterの古典的なテキスト( "Statistics for Experimentalers"、Wiley、1978)も役立つかもしれません。113ページ以降の「信頼区間のセット」をご覧ください。


私たちは部分的に概念と部分的にセマンティクスを扱っているので、2番目の文で、どの文が真になるかを指定せずに「...その性質の文が真になる...」と言ったことを指摘します。
rolando2
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.