信頼区間の解釈


15

注:これが重複している場合は事前に謝罪しますが、検索で同様のqが見つかりませんでした

真のパラメーターpがあるとします。信頼区間C(X)は、たとえば95%の時間を含むpを含むRVです。ここで、Xを観察してC(X)を計算するとします。一般的な答えは、「pを含むまたは含まない」ため、「95%の確率でpを含む」と解釈するのは間違っているようです。

しかし、シャッフルされたデッキの一番上からカードを選び、裏向きのままにしておきましょう。直感的には、このカードがスペードのエースである確率は、実際には「スペードのエースであるか、そうではない」としても1/52であると思います。この推論を信頼区間の例に適用できないのはなぜですか?

あるいは、カードが「あり」または「なし」であるためにスペードのエースであるという「確率」について話すのが意味がない場合でも、スペードのエースではないという51:1のオッズがあります。この情報を説明する別の言葉はありますか?この概念は「確率」とどう違うのですか?

編集:確率のベイジアン解釈から、より明確になるかもしれません、確率変数の実現が95%の確率で含まれていると言われた場合、その確率変数の実現(および条件付けする他の情報はありません)確率変数がpを含む95%の確率を持っていると言って正しいですか?

編集:また、頻度の頻度の確率の解釈から、頻度の専門家が「信頼区間にpが含まれる確率は95%である」などのことを言わないことに同意するとします。信頼区間にpが含まれているという「信頼」を頻繁に持っている人にとって、それはまだ論理的ですか?

alphaを有意水準とし、t = 100-alphaとします。K(t)は、信頼区間にpが含まれているという頻度主義者の「信頼」です。K(t)はtで増加するはずです。t = 100%の場合、周波数範囲は(定義により)信頼区間にpが含まれているという確実性があるはずです。したがって、K(1)= 1を正規化できます。同様に、K(0)= 0。 0と1、およびK(0.999999)は大きいです。頻度論者はどのようにKをP(確率分布)とは異なると考えますか?


1
確かに、コインがテーブルの下で転がるコインフリップを考えてみてください。そして、コインが頭に着地したというイベントを考えます。一見したところ、これはCIの問題と非常によく似ているようです。明らかに、イベントが発生したか、発生しなかったかのどちらかです。しかし、コインフリップケースでは、多くの(おそらくほとんどの)頻度論者は、頭上にある観察されていないコインに概念上の確率()を割り当てることで完全に満足しているように見えます。パラメータ。私には矛盾があるようです。p
Glen_b -Reinstateモニカ

@Glen_b観測されていないドロップコインシナリオのフリークエンティストは、コインの実際の額面が「ランダム」(観測されていない)ではなく、観測された結果をこのドロップの他の潜在的な結果一般化できると言う反事実的推論を適用しますコインと確率を計算します。コインの実際の額面の確率に関する限り、それは頭であるか頭ではないかのいずれかであり、確率はありません。、この設定の反事実構築のために保存されます。p
AdamO

@Glen_b:私は同意し、ここで私の質問を参照してください。stats.stackexchange.com/questions/233588/...
vonjd

@vonjdあなたの質問は、ここで最初の「注:」の後の最初の段落の単なる複製ではありませんか?
Glen_b -Reinstateモニカ

@Glen_b:正直に言うと、私の質問を投稿したとき、私はこの質問に気が付きませんでした。しかし、私は一般的に隠された結果(信頼区間に結果をもたらす)の確率を使用することに関心があるのに対し、これは純粋に信頼区間を目指しているため、それらは複製ではないと思います。しかし、もし私のものが重複していると思うなら、遠慮なく閉じてください。
vonjd

回答:


8

この問題に関する従来の説明の多くは明確ではないと思います。

サイズサンプルを取得し、pの95 信頼区間を取得するとします。10095%p

次に、最初のサンプルとは別に別のサンプルを取得し、pの別の95 信頼区間を取得します。10095%p

変化するのは信頼区間です。変わらないのはです。p つまり、頻繁な方法では、信頼区間は「ランダム」ですが、は「固定」または「定数」、つまりランダムではないということです。信頼区間の方法などの頻繁な方法では、確率はランダムなものにのみ割り当てられます。p

L U Pr(L<p<U)=0.95(L,U)U = L U pL=U=LUp

レッツはで言う特定のあなたが持っているインスタンスと。頻繁な方法では、または確率以外に、ステートメントに確率を割り当てません。ここではランダムではないです:はランダムではなく、はランダムではありません(新しいサンプルを取得します)、はランダムではありません。U = 43.61 40.53 < p < 43.61 0 1 40.53 p 43.61L=40.53うん=43.6140.53<p<43.610140.53p43.61

実際には、人々はがから間であることを確信しているように振る舞います。そして実際問題として、それはしばしば意味をなすかもしれません。しかし、そうではない場合もあります。そのようなケースの1つは、以上の数がありそうにないことが事前にわかっている場合、または非常に高い可能性があることがわかっている場合です。事前確率分布をに割り当てることができる場合、ベイズの定理を使用して信頼区間を取得します。これは、の値の範囲の事前知識により、信頼区間とは異なる場合があります。95%p40.5343.6140ppありそうかありそうもない。また、実際にデータ自体が発生する可能性があります。新しいサンプルが取得された場合に変化することにより、がになりそうにない、またはそうでないことさえあることがわかります。これは、ペアがに対して十分な統計量である場合でも発生する可能性があります。この現象は、場合によっては、補助的な統計を調整するフィッシャーの方法によって対処できます。この最後の現象の例は、サンプルが間隔均一に分布している2つの独立した観測のみで構成されている場合です。次に、2つの観測値のうち小さい方から大きい方までの間隔はp40(L,U)pθ±1/250%信頼区間。しかし、それらの間の距離がある場合は、どこでも近くであることを不合理になることを確認してそれらの間で、距離がある場合は、1が合理的にほとんどだろうわからそれらの間です。それらの間の距離は、条件となる補助的な統計になります。0.00150%θ0.999100%θ


マイケルに感謝します。あなたの例では、特定の(L、U)がありますが、値は認識されていないと仮定しましょう。わかっているのは、95%信頼区間の確率変数の実現であるということだけです。パラメーターやその他の情報に関する事前情報がなければ、(L、U)がパラメーターを含むという19:1のオッズを設定するのは公平でしょうか?頻繁に行う人がこれを行うことを望んでいるが、「パラメータを含む19:1のオッズを置く意思」を「確率」と呼ばない場合、それを何と呼びますか?
applicative_x

はい、その確率はです。確かに、頻繁な方法の中で、の無知の状態では、その区間にが含まれる確率はであると言えます。しかし、ランダムではない特定の値がある場合、と既知の値はランダムではないため、フリークエンシー奏者はまたは以外の確率をステートメントに割り当てません。0.95(L,U)0.95p01LU
マイケルハーディ

3

%信頼区間の教科書の定義は次のとおりです。100×(1α)

理想的な条件下での研究の多くの独立した複製の下で、時間の%の複製された効果測定をキャプチャする間隔 。100×(1α)

頻繁に発生する可能性は、科学的発見を何度も何度も評価するために無限の数の世界のコピーが作成されたかのように、発見を再現する「時間と空間を巻き戻す」という概念に由来します。したがって、確率は正確に頻度です。科学の第一原理は研究は複製可能でなければならないということなので、科学者にとってこれは発見を議論するための非常に便利な方法です。

あなたのカードの例では、ベイジアンとフリークエンティストの混乱は、フリージニストがあなたがデッキから反転した特定のカードの額面に確率を割り当てないのに対して、ベイジアンはそうすることです。frequentistはに確率を割り当てるだろうランダムにシャッフルデッキの上から反転カード。ベイジアンは研究の再現に関心がなく、カードが裏返されると、カードが何であるかについて100%の信念を持ち、他の値を取る可能性があるという0%の信念を持つようになります。ベイジアンにとって、確率は信念の尺度です。

この理由から、ベイジアンは信頼区間を持たず、不確実性を信頼区間で要約していることに注意してください。


回答ありがとうございます。カードの例では、ベイジアンとフリークエンティストの両方が、51:1がカードがスペードのエースであるというかなりのオッズであることに同意しませんか?同様に、95%の信頼区間(および他の情報なし)を実現するために、両方が真のパラメーターを含むという19:1のオッズはないでしょうか?その意味で、ベイジアンは95%の信頼区間を真のパラメーターを含む可能性が95%であると解釈できますか?
applicative_x

@applicative_xピノクルデッキはどうですか?事前情報の使用を検討しています。頻度は、確率が 1/52であるという仮説を立てるだけで、この実験がその仮説と一致しているか矛盾しているかを通知するためにカードの額面のみを使用します。任意のタイプの間隔推定の妥当性(信頼性または信頼性)は、検証不可能な仮定に依存します。真のパラメーターなどはありません。これは科学についての危険な考え方です。ベイジアンは、以前の定義では信頼区間を使用しません。答えを読み直してください。p=1/52
AdamO

アダムのおかげで、私はまだ混乱していると思います。52カードデッキが標準であることを(カードを見て)知っているとしましょう。デッキをシャッフルし、見ずにトップ10のカードを選びます。この場合の「真のパラメーター」をレッドカードの数に定義できませんか?次に、ベイジアン対頻度論者に関係なく、「真のパラメーター」があります。ランダムに7枚のカードを選ぶことが許可されている場合、10枚のうち#枚のレッドカードの信頼区間を構築することも想像できます。–
applicative_x

1
ベイジアンは、パラメーターの真の値のようなものがないと信じる必要はありません。ベイジアン主義とは、ランダムであるかどうかにかかわらず、不確実なステートメントに確率を割り当てることを意味します。Aベイズ確率割り当てることができますの人生は億年前の火星にあったことを声明に。それがすべてのケースの半分で起こったと言うことはできないので、頻繁に行うことはできません。その中の何も、ベイジアンが火星にそのような生命があったかどうかという質問に対する本当の答えがあると信じることができないと言いません。あなたの質問に対する私の投稿された答えも参照してください。1/2
マイケルハーディ

1
@AdamO:あなたのコメントは不可解だと思う。「どのユーティリティが「真実」の概念であるか」は主題の変更です。「真実は不変だと考えています。」「私たち」とは、あなたと他の誰を意味し、彼らが考えることの関連性は何ですか?「すでに知られているものを検証するためにデータを収集しようとする科学者はいません。」それは主題の別の変更のようです。それから、頻度主義者とベイジアンに関するいくつかのコメントに従います。あなたが何を言おうとしているのか推測する気がしません。
マイケルハーディ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.