信頼区間の解釈に関する明確化?


47

「信頼レベル信頼区間」という概念についての私の現在の理解は、信頼区間を何度も(毎回新鮮なサンプルで)計算しようとすると、正しいパラメーターが含まれることです。時間。1 - α1α1α

これは「真のパラメーターがこの間隔にある確率」と同じではないことに気づきましたが、明確にしたいことがあります。

[メジャーアップデート]

95%の信頼区間を計算する前に、計算した区間が真のパラメーターをカバーする95%の確率があります。信頼区間を計算し、特定の区間を取得した後、これを言うことはできません。真のパラメーターがことを95%確信しているというある種の非頻度論的議論さえすることはできません。可能であれば、このような反例と矛盾するからです。正確には、信頼区間とは何ですか?[ a b ][a,b][a,b]

これを確率論についての議論にしたくありません。代わりに、特定の間隔が表示される方法と理由について、その間隔を表示する前の95%の確率が正確に変化する(または変化しない)数学的な説明を探しています。あなたは「インターバルを見た後、確率の概念はもはや理にかなっている」と主張していない場合は、罰金、それはここで、確率の解釈での仕事をさせないメイクセンスを。[a,b]

より正確に:

コンピューターをプログラムして95%の信頼区間を計算するとします。コンピューターはいくつかの計算処理を行い、間隔を計算し、パスワードを入力するまで間隔の表示を拒否します。パスワードを入力して間隔を確認する前(ただし、コンピューターが既に計算した後)、間隔に真のパラメーターが含まれる確率はどれくらいですか?95%であり、この部分は議論の余地はありません:これは、この特定の質問に興味がある確率の解釈です(私が抑制している主要な哲学的問題があることを認識し、これは意図的です)。

しかし、パスワードを入力して、コンピューターに計算された間隔を表示させると、確率(間隔に真のパラメーターが含まれる)が変わる可能性があります。この確率が決して変わらないという主張は、上記の反例と矛盾します。この反例では、確率は50%から100%に変化しますが、...

  • 確率が100%または0%以外に変化する例はありますか(編集:もしそうなら、それらは何ですか)。

  • 特定の間隔見ても確率が変わらない例はありますか(つまり、真のパラメーターがある確率はまだ95%です)。[ a b ][a,b][a,b]

  • コンピューターが吐き出す見た後、一般に確率はどのように(そしてなぜ)変化しますか?[a,b]

[編集]

すべての素晴らしい回答と有益な議論をありがとう!


1
これにより、いくつかの興味深い点が得られる場合があります。en.wikipedia.org
nico

P(E | C)= 1およびP(E | C ')= 0という仮定は不当です。実際の間隔に真のパラメーター値が含まれていない場合、この後者の値は確実にその範囲外にあると述べるのはなぜですか?
グラッシー

「実際の間隔」または「後の間隔」の意味がわかりません。明確にしていただけますか?
エリオット

@nicoリンクをありがとう。私の元々の質問の意図は、「信頼区間はベイズの信頼できる区間として解釈できることを示すように思えますが、そうではないので、私の推論のどこが悪いのか」です。しかし、「間隔に[未知の]真のパラメーターが含まれる確率は0または1である」という概念に満足していません。私にとって、それは「コインをひっくり返した後、見る前に頭が上陸する確率は0または1である」と言っているようなものです。なぜ1/2ではないのか分かりません。
エリオット

@エリオット:シュレーディンガーの猫は頭に浮かぶ:)私はあなたに適切な説明をするのに十分な専門家ではありませんが、私はこれに対する答えを見たいです。PS:コインも端に落ちる可能性があることを忘れないでください!
ニコ

回答:


28

基本的な問題は、頻度の高い統計では、実行頻度の長いものにしか確率を割り当てられないことだと思います。パラメータの真の値が特定の間隔にあるかどうかに関係なく、実行頻度は長くありません。実験は1回しか実行できないため、頻度の確率を割り当てることはできません。問題は確率の定義から生じます。確率の定義をベイジアンの定義に変更すると、長期実行頻度の議論に縛られなくなるため、問題は即座に消えます。

ここで関連する質問への私の(むしろ頬の舌)答えを参照してください:

フリークエンティストは、確率がイベントが発生する長期的な頻度を表していると考えている人です。必要に応じて、彼はあなたの特定の状況をランダムなサンプルと見なせる架空の集団を発明し、長期的な頻度について有意義に話せるようにします。あなたは彼に特定の状況についての質問を、彼は直接答えを与えるが、その代わりに、この(おそらく架空の)人口についての声明をすることはありません。

信頼区間の場合、(たとえば品質管理に問題がない限り)通常尋ねる質問は、「このデータのサンプルが与えられると、確率のあるパラメーターの真の値を含む最小区間を返します。バツ"。ただし、実験は1回しか実行されないため、頻度を上げることはできません。そのため、確率の割り当てに使用できる長期実行頻度はありません。その代わり、頻繁に使用する実験は、実行した実験をランダムなサンプルと見なすことができる実験の集団を作成する必要があります(実行しなかった)頻繁に使用する人は、特定の実験について本当に聞きたい質問に対する直接的な答えではなく、その架空の実験集団についての間接的な答えを提供します。

本質的には言語の問題であり、人口の頻繁な定義では、特定の間隔にあるパラメーターの真の値の確率を議論することはできません。それは、頻繁な統計が悪い、または役に立たないという意味ではありませんが、制限を知ることは重要です。

メジャーアップデートについて

「95%の信頼区間を計算する前に、計算した区間が真のパラメーターをカバーする確率は95%である」と言えるかどうかはわかりません。頻繁なフレームワーク内。ここで、特定の方法で構築された信頼区間にパラメーターの真の値が含まれる長期実行頻度は、特定のサンプルの信頼区間にパラメーターの真の値が存在する確率でもあるという暗黙の推論があります。使用するデータの数。これは完全に合理的な推論ですが、特定のデータサンプルに対して構築した信頼区間にパラメーターの真の値が存在する確率は、長期的な頻度を持たないため、ベイジアン推論であり、頻度の高い推論ではありません。データのサンプルは1つだけです。

しかし、「真のパラメーターが[a、b]にあることを95%確信しているある種の非頻度論的引数を作成する」ことができます。頻繁な信頼区間と正確に一致します。

「これを確率の哲学についての議論にしたくない」、悲しいことにこれは避けられない、統計の真の値が信頼区間にあるかどうかに頻繁な確率を割り当てることができない理由確率の頻繁な哲学の。頻度論者は、哲学で確率を定義する方法であるため、長期実行頻度を持つことができるものにのみ確率を割り当てることができます。それは頻繁な哲学を間違ってはいませんが、確率の定義によって課せられた限界を理解することは重要です。

「パスワードを入力して間隔を確認する前(ただし、コンピューターが既に計算した後)、間隔に真のパラメーターが含まれる確率はどのくらいですか?95%であり、この部分は議論の余地がありません:」が間違っているか、少なくともそのようなステートメントを作成する際に、あなたは頻繁な統計の枠組みから離れ、長期的な頻度ではなく、ステートメントの真実性のある程度の妥当性を含むベイジアン推論を行いました。ただし、前述したように、これは完全に合理的で自然な推論です。

nietherイベントには頻繁な確率を割り当てることができるため、パスワードを入力する前後に何も変更されていません。特定のイベントに関する記述の妥当性の程度について質問したい場合が多いため、頻度統計は直観に反する場合がありますが、これは頻度統計の範囲外であり、これが頻度手続きのほとんどの誤解の原因です。


2
はい、それは私が非常に重要な点です。2番目のステートメントは、実際にはこの特定のコインに関するステートメントではありません。これは、ほとんどの人が特定のコインに関する記述として誤って解釈する、想像上のコインの人口に関する記述です。ただし、その飛躍を実現するために、確率に関するベイジアン直観を適用し、信頼区間が実際に何であるかを無視しています。コインの状態に確率を割り当てるのに問題はありません。ただし、確率の頻繁な定義から遠ざけます。
ディクランマースピアル

2
明確にするために、「時間の始まりの多くの別々のインスタンスを想像してください。あなたはそれらの約半分が頭を生成すると予想するでしょう」と完全に正しい頻度論的推論です。ただし、そこから「したがって、この特定のコインも0.5である確率」に進むことは、確率が1回だけしか発生しない可能性があるため、長い実行頻度を持たないものに確率が適用されるわけではありません。しかし、ベイジアン確率は命題の妥当性に関する記述であるため、完全に健全なベイジアン推論です(これは母集団内の長期実行頻度に基づく場合があります)。
ディクランマースピアル

1
両方の質問に対する彼の答えは、実際には、頭に着くであろうコインの想像上の人口の割合についての声明です。しかし、これは明確にされない可能性が高く、人々は一般的に有用であり(間接的な回答は一般的にそれほど有用ではない)、また、頻度の高い統計はかなり直感に反し、頻度の高い人は避けるためにこの点を回避する可能性が高い混乱。特定のフリップに関する確率的な統計を作成するために固定されている場合、良いフリークエンティストは単に答えることを拒否します-それはフリークエンシー主義の統計の範囲外にあります。
ディクランマースピアル

1
本質的には、フリークエンシストは実際にあなたの質問に答えず、コインフリップの人口について声明を出し、その特定のフリップでの頭の確率は暗黙の人口の割合と同じだったと推測させます。 。しかし、それは彼ではなく、あなたのベイジアン推論です。
ディクランマースピアル

1
@Aaron Sure、あなたは多くのことについて「確率は0または1のいずれか」と言うことができますが、その答えは私たちに絶対に何も買わない(たとえば、私たちがゲームにどれだけ賭けるべきかについての具体的な質問に答えたい場合スペースシャトルを打ち上げるべきかどうか)。また、「発生する可能性のある」ことは次のとおりです。(1)コインが頭に着地し、あなたがそれを覆いました、(2)コインが着地し、尾を覆いました。多くの「反転とカバー」試行の「想像上の人口」では、約50%が頭を見ることになります。
エリオット

14

メジャーアップデート、メジャーニューアンサー。問題があるところだから、この点に明確に取り組んでみよう。

「「間隔を見た後、確率の概念はもはや意味をなさない」と主張するなら、それでは、意味のある確率の解釈に取り組みましょう。」

確率のルールは変わりませんが、宇宙のモデルは変わります。確率分布を使用して、パラメータに関する以前の信念を定量化する意思がありますか?データを見た後にその確率分布を更新するのは合理的なことですか?そう考えると、ようなステートメントを作成できます。私の事前分布は、一般的に理解されているランダムさだけでなく、自然の本当の状態についての不確実性を表すことができます -つまり、前の分布をurの中の赤いボールの数に割り当てると、赤いボールのランダムです。それは修正されましたが、私はそれについて不確かです。P(θ[L(X),U(X)]|X=x)

私を含む数人がこれを言ったが、をランダム変数と呼ぶことをないなら、ステートメントはそうではない意味のある。私が頻繁な場合は、を固定量として扱い、確率分布を割り当てることはできません。どうして?それは固定されており、確率の私の解釈は長期的な頻度に関するものだからです。nの中の赤いボールの数は変わりません。はです。いくつかのボールを引き出した場合、ランダムなサンプルがあります。ランダムなサンプルをたくさん取ったらどうなるかを尋ねることができます-つまり、について話すことができますP θ [ L X U X ] | X = X θ θ θ P θ [ L X U X ] θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) 間隔はサンプルに依存しているため、サンプルはランダムです(待ってください!)。

しかし、あなたはそれを望んでいません。あなたが欲しいこの期間、私は私の観察(現在は固定)で構成する確率は何だサンプルは、パラメータが含まれています- 。ただし、条件にすると、頻繁に使用する私には、ランダムなものは何もなくなり、ステートメントは ' tは意味のある方法で意味をなします。X = X P θ [ L X U X ] | X = X P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

に関するステートメントを作成する唯一の原則的な方法(IMO)は、(前の)確率分布を持つパラメーターに関する不確実性を定量化することです。ベイズの定理を介して新しい情報でその分布を更新します。私が見た他のすべてのアプローチは、ベイズへの不鮮明な近似です。あなたは確かに頻繁な見地からそれをすることはできません。P(θ[L(X),U(X)]|X=x)

それは、ベイジアンの観点から伝統的な頻度主義の手順を評価できないと言うことではありません(多くの場合、信頼区間は一様な事前分布の下で信頼できる区間です) (私はそれができると思う)。それはそうではないので、古典的/頻度論的統計が役に立たないと言うことではありません。それはそれが何であるかであり、私たちはそれをもっとしようとするべきではありません。

パラメータに事前分布を与えて、宇宙に関するあなたの信念を表すことは合理的だと思いますか?あなたのコメントからはあなたがそうしているように聞こえます。私の経験では、ほとんどの人が同意するでしょう(@G。Jay Kernsの答えへの私のコメントで行ったちょっとした冗談です)。その場合、ベイジアンパラダイムは、に関するステートメントを作成する論理的で一貫した方法を提供します。頻繁なアプローチは単純にそうではありません。P(θ[L(X),U(X)]|X=x)


1
(+1)非常によくやった、再び、死点にスポット。

+1上記と同じコメント(G.ジェイカーンズの回答を参照); これは本当に役に立ちました。
エリオット

Bounty schmounty :)お役に立ててうれしいです。
JMS

11

OK、今話しています!このメジャーアップデートされた質問では意味をなさないため、以前の回答を削除することに投票しました。

この新しい更新された質問では、95%の信頼区間を計算するコンピューターを使用して、正統派の頻度主義の解釈の下で、あなたの質問に対する答えを以下に示します。

  1. 番号。
  2. 番号。
  3. 間隔が観察されると、それはもはやランダムではなく、変化しません。(たぶん、間隔はだったかもしれません。)しかし、変わらず、変わっていません。(おそらく、です。)コンピューターがカバー7を計算する間隔の95%がカバー7を計算しないため、確率は95%から0%に変わりますが、間隔 100%は7をカバーしません。θ θ = 7 [ 1 3 ][1,3]θθ=7[1,3]

(ちなみに、現実世界では、実験者は知らないため、実験者はが真の確率でゼロか1 かを知ることはできません。それはどちらかでなければならないということです。)それに加えて、実験者はコンピューターの間隔の95%がカバーしていると言うことができますが、私たちはすでにそれを知っていました。[ 1 3 ] θ θθ=7[1,3]θθ

あなたの質問の精神は、観察者の知識にヒントを与え続け、それが位置にどのように関連するかを示します。それが(おそらく)あなたがパスワードについて話していた理由であり、コンピューターがまだ見ずに間隔を計算しているなどです。答えに対するあなたのコメントで、0または1にコミットする義務があるとは不満足/見苦しいと思われますが、結局、87%、、または99%であると信じられないのはなぜですか? ?しかし、それはまさに、頻繁なフレームワークの力であり、同時にアキレス腱です。観察者の主観的な知識/信念は無関係です。重要なのは、長期的な相対頻度です。これ以上でもそれ以下でもありません。15 / 16θ15/16

最終的なところで:確率の解釈を変更した場合(この質問に対して意図しないことを選択した場合)、新しい答えは次のとおりです。

  1. はい。
  2. はい。
  3. 確率=主観的知識、または信念の程度、および観測者の知識が変化したため、確率が変化します。事前/事後分布で知識を表し、新しい情報が利用可能になると、前者は後者に変化します(ベイズの規則を介して)。

(ただし、完全な開示のために、あなたが説明する設定は主観的な解釈とはあまり一致しません。たとえば、通常、コンピューターの電源を入れる前に95%の信頼できる間隔があります。通常、前の間隔よりもかなり細い95%の後方の信頼できる間隔を使用します。)


再び!:) よくやった。
JMS

3
ベイズの確率の解釈は必ずしも主観的なものではないことを指摘しておく必要があります。したがって、それは実際には頻繁なアプローチの強みではありません。「コインの着陸確率の問題」に対する客観的なベイジアンアプローチの場合、情報価値のない事前確率を使用すると、主観性がまったく関係しなくなります。頻繁なアプローチの真の強みは、品質管理などの問題にあります。これは、繰り返し試行や長期実行の頻度について話すのが自然なことです。特定のイベントについて質問するときにのみ問題が発生します。
ディクランマースピアル

@JMS、ありがとう。@Dikran、コンピューター画面の小さな箱の中の544文字でそれについて話すのは難しい。簡単に言うと、「ベイジアン」という言葉は「主観的」と同義語ではないことに同意します。そして、どちらのアプローチの本当の強みが本当にあるのかを特定しようとする意味はありません。結論:長期的な相対頻度については全員合意できますが、多くの場合、後部は私のものとは異なります。

2
@Dikran Marsupialあなたは良い点を挙げています。過去のおもちゃの問題を実際の応用モデリングに移すと、前の分布自体ではなく、尤度を指定する方法によって本当に重要な主観が生じることがよくあります(これらの観測は本当に交換可能ですか?ガウスですか?等)。そのようにして、主観性は、モデルベースの統計の膨大な部分に組み込まれます。ベイジアンも頻度も同様です。
JMS

+1美しい答えをありがとう。これは間違いなく賞金に値するが、政治的であることを避けるために、私は結局賛成票を投じることになった。
エリオット

6

2セントを投入します(以前の回答の一部を再消化する可能性があります)。頻度主義者にとって、信頼区間自体は本質的に2次元のランダム変数です。実験を何億回もやり直す場合推定する信頼区間(つまり、毎回新しく見つかったデータから計算する)は毎回異なります。 。そのため、区間の2つの境界は確率変数です。

したがって、95%CIは、このランダム変数のセットに95%のケースで真の値(非常に頻繁な表現)が含まれるという保証(このCIにつながるすべての仮定が正しいと仮定した場合)にすぎません。

標準正規分布からの100引きの平均の信頼区間を簡単に計算できます。次に、その標準正規分布から100個の値を10000回引き出し、そのたびに平均の信頼区間を計算すると、実際には0が約9500回存在することがわかります。

あなたがいるという事実している(実際のデータから)一度だけ信頼区間を作成したが、実際にある真の値の確率減らすんその 0または1のいずれかに間隔を、それがAと信頼区間の確率を変更しません真の値を含むランダム変数。

だから、一番下の行:確率任意の真の価値を収容する(すなわち、平均で)真の値(95%)を含有する95%信頼区間がない変更を行わず、どちらも特定の区間の確率を行い(CIまたは何でも) (0または1)。コンピューターが知っているがあなたが知らない間隔の確率は実際には0または1です(特定の間隔であるため)が、あなたはそれを知らないので(そして、頻繁に、この同じ間隔を再計算することはできません)同じデータから何度も繰り返します)、あなたが行かなければならないのは、間隔の確率だけです。


おもしろい注:このサイトのスペルチェック機能は、frequentistという単語が中かっこに下線を引く価値があると判断しています。このサイトは、ベイジアンによって密かにマスターされていますか?ああ、私はそうではないと思います、なぜならベイジアンには独自のカーリーアンダーラインがあるからです:
ニック・

4

信頼区間が「真のパラメーターが区間内に存在する確率」を指定しない理由は、区間が指定されると、パラメーターがその区間内にあるか、そうでないためです。ただし、たとえば95%の信頼区間の場合、値を含む信頼区間を作成する可能性は95%です。これは把握するのが非常に難しい概念なので、うまく表現できないかもしれません。詳細については、http://frank.itlab.us/datamodel/node39.htmlを参照してください


2
信頼区間を計算するためにコンピューターをプログラムしますが、出力を見ていないとします。出力を確認する前に、間隔に正しいパラメーターが含まれている可能性が95%あることを知っています(コインフリップの結果を確認する前と同じように、50%の可能性があることを知っています)。最初に正しいパラメーターがわからない場合、その後出力を見るとどのようにこの確率が変化しますか?(コインフリップの結果を見ると、ヘッドの確率が50%から1に変わることに同意しますまたは0)?
エリオット

さらに、私は区別があることに同意しますが、上記の「引数」が同じものであることを示していることの何が問題なのか疑問に思っています。
エリオット

2
@Elliottあなたの質問は、このアナロジーと同じように見えます:あなたは公正なコインをひっくり返します。エルゴ、ヘッドの確率は50%です。今、あなたはコインを見て、それが頭です。これにより、ヘッドの確率がどのように変わりますか?答えはそうではないということです。なぜなら、確率は結果ではなくコイン反転手順を参照しているからです。あなたが参照する反例は同様の方法で機能するようです:プロシージャはパラメータをカバーする可能性が50%あるかもしれませんが、実際にはパラメータが実際にカバーされていることを確認することが可能になりました。だから何?
whuber

私は、公正なコインが頭になる確率を変えることについて話しているのではありません。代わりに、この特定のコインが頭になる確率を変えることについて話している。私がそれを裏返した後、そしてそれを見る前に、私はそのようなケースの約半分がヘッズアップのコインを含むので、問題の確率は50%であると主張します。一方、私がそれを見て頭を見た後、そのようなケースの100%は頭を上げたコインに関係しています(コインを見て頭を見ていないときに尾を上げたケースは排除されました)。
エリオット

事後、パラメータがカバーされたことを確認できる可能性があることに同意します。「だから何?」に対する私の答え 「(上の質問の)上記の議論は間違っていなければならないので、何が間違っているのだろう」
エリオット

4

私は、特定のサンプルの信頼区間にある統計の真の(人口)値の可能性があると、周波数専門家が言うことはできないと思います。それはそうであるかそうでないかのどちらかですが、特定のイベントには長い実行頻度はなく、統計手順を繰り返し実行することで得られるイベントの母集団だけです。これが、「構築された信頼区間の95%が統計の真の値を含む」などのステートメントに固執しなければならない理由ですが、「真の値がこの特定の計算された信頼区間にある確率がp%サンプル"。これはpのすべての値に当てはまります。確率が実際に何であるかを頻繁に定義することでは不可能です。しかし、ベイジアンは、信頼できる間隔を使用してこのようなステートメントを作成できます。


3

E[a,b]

E~(L(X),U(X))

編集:@G。ジェイ・カーンズは私よりも議論を上手く進め、より速くタイプするので、おそらくただ一緒に進んでください:)


[a,b]

2
|

私は知りません、あなたのものはスポットオンです。:-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


この特定の間隔[a、b]が真のパラメーターを含むイベントとしてCを定義したことを考えると、EとC / C 'が独立していることに同意するかどうかはわかりません。 。
エリオット

しかし、Cはランダム変数です!すべてがすでに発生した後に、これらすべてのイベントの定義を変更するようなものです。別の言い方をすれば、Cをこの特定のイベントとして定義している場合、Cは信頼区間ではなくなります。
-raegtin

2
問題は、Cが実験のこの特定の実行で間隔にtrueパラメーターが含まれるイベントである場合、長い実行頻度がないため(特定の実行は1回しか実行できない)、したがって割り当てできないことです。それへの頻繁な確率。これが、頻繁な信頼区間の定義が、再現された実験の母集団という点である理由です。あなたは、ベイジアン推論を頻繁な設定に適用しているようで、確率の定義の不一致があります。
ディクランMarsupial

これを見る別の方法があります。あなたがしているように見えることは次のとおりです:信頼区間[a、b]を取得するために計算を実行します。Cを、この特定の信頼区間[a、b]に真のパラメーターが含まれるイベントとして定義します。また、この特定の間隔[a、b]にtrueパラメーターが含まれるイベントとしてEを定義します。したがって、EとCは同じイベントです!
-raegtin

それはあなたが実際にやっていることです。あなたは次のことをしている思われるようです(あなたはそうではありません):計算#1を実行して間隔[a、b]を取得します。Eを、この特定の間隔[a、b]にtrueパラメーターが含まれるイベントとして定義します。次に、計算#1を忘れて、他の計算された間隔[a '、b']に真のパラメーターが含まれるイベントとしてCを定義します。この場合、EとCは独立しています。
-raegtin

2

ここには非常に多くの長い説明があるので、それらを読む時間はありません。しかし、基本的な質問に対する答えは短くて甘いものになると思います。これは、データに無条件の確率の差です。ダットを収集する前の1アルファの確率は、明確に定義された手順にパラメーターが含まれる確率です。データを収集し、生成した特定の間隔がわかったら、間隔は固定されます。したがって、パラメーターは定数であるため、この条件付き確率は0または1になります。しかし、パラメーターの実際の値データを収集した後、どの値であるかはわかりません。

Michael Chernickによる投稿の拡張は、フォームのコメントをコピーしました:

これには病理学的な例外があり、これは完全推定と呼ばれます。X(n)= pX(n-1)+ enで与えられる一次自己回帰プロセスがあるとします。静止しているので、pは1または-1ではなく、絶対値で1未満です。これで、enは混合分布で独立して同一に分散され、en = 0の正の確率qがあります。

これには病理学的な例外があり、これは完全推定と呼ばれます。X(n)= pX(n-1)+ enで与えられる一次自己回帰プロセスがあるとします。静止しているので、pは1または-1ではなく、絶対値で1未満です。

これで、enは混合分布で独立して同一に分散され、en = 0の正の確率qがあり、確率1-qでは絶対連続分布になります(たとえば、0から離れた区間で密度がゼロではありません。時系列からデータを連続的に収集し、値の連続する各ペアについてX(i)/ X(i-1)でpを推定しますei = 0の場合、比率は正確にpに等しくなります。

qは0よりも大きいため、比率は値を繰り返し、その値はパラメーターpの正確な値である必要があります。なぜなら、eiの値でない場合、0ではない確率0とei / x(i -1)繰り返しません。

したがって、連続停止規則は、比率が正確に繰り返されるまでサンプリングし、その繰り返し値をpの推定値として使用することです。pであるため、この推定を中心とする構築した任意の区間は、真のパラメーターを含む確率1を持ちます。これは実用的ではない病理学的例ですが、エラー分布に必要な特性を持つ定常確率過程が存在します


2
代わりに、これらのいくつかのコメントの過程で説明した例を、回答に追加することを検討しましたか?
マクロ

@Michael 2番目のマクロのコメント。コメントは、一般的に、他のユーザ(例えば、明確化を要求する、など)と対話するための方法として考えていることに注意してください、そしてどのような場合には、時には「として表示されているスタックExchange内の第三級市民」。ただし、最新の交換に続いて、この一連のコメントをどのように進めるかを決定できます。この発言はここにある別の一連のコメントに適用されます
chl

回答が実際に質問に回答していないと誰かが判断した場合、特に多くの議論を含む回答に投票するポリシーがあるように思われるため、回答にコメントを入れません。したがって、答えは答えを与えることであり、コメントはコメントの下に入ります。私のコメントは文字数制限を超える傾向があるため、いくつか使用します。
マイケルチャーニック

@MichaelChernickそのようなポリシーはないので、あなたのコメントを投稿に組み込みました。

1
@MichaelChernick、私はこのサイトに約1年間かなり定期的に投稿してきましたが、モデレーターが抑圧的である、またはサイトのルールが混乱していると示唆する人を聞いたことはありません。re:投稿に遭遇した問題は、FAQで明示的に議論されているものです。
マクロ

1

まだ役立つかもしれない多くの質問と回答についての2つの観察。

混乱の一部は、1940年代頃まで確固たる数学的基盤になかった確率理論のより深い数学を論議することから来ています。サンプル空間、確率空間などの構成要素になります。

最初に、コインフリップの後、頭に来た場合に尾が出なかった確率は0%であることがわかりました。その時点では、確率について話すことは意味がありません。何が起こったのか、私たちはそれを知っています。確率は将来の未知のものであり、現在の既知のものではありません。

ゼロ確率が実際に何を意味するかについての小さな帰結として、これを考慮してください:フェアカウントには、0.5のヘッドがアップする確率と、0.5のテールがアップする確率があると仮定します。これは、結果がMECE(相互排他的かつ完全に網羅的)であるため、頭または尾のいずれかが現れる確率が100%であることを意味します。ただし、頭と尻尾の縮約についてはゼロパーセントの変更があります。「頭」と「尾」の概念は、それらが相互に排他的であるということです。したがって、これは、「コインを投げる」ことを考える(または定義する)方法では不可能であるため、チャンスはゼロです。トスの前後では不可能です。

これにさらに当然の結果として、ないものは、定義上、不可能である可能性。現実の世界では、弁護士が「この文書に署名して忘れてしまったのではないか」と尋ねるのは嫌です。質問の性質上、答えは常に「はい」だからです。また、「非物質化によって惑星レムラック4に運ばれ、それを記憶せずに何かを強制的に送り返された可能性はありませんか?」という質問に対する答えも「はい」です。可能性は非常に低いかもしれませんが、不可能ではないことが可能です。確率の通常の概念では、コインの反転について話すとき、頭に浮かぶかもしれません。尾が上がるかもしれません。そして、それは端に立ったり、(どういうわけか、薬を飲んだり軌道に乗っている間に宇宙船に忍び込んだように)永遠に空中に浮かぶかもしれません。しかし、トスの前後に、 同時に尾:実験のサンプル空間で相互に排他的な結果です(「確率サンプル空間」と「シグマ代数」を調べてください)。

第二に、信頼区間に関するこのすべてのベイジアン/周波数主義の哲学では、周波数主義者が周波数主義者として行動している場合、それが周波数に関連するのは事実です。したがって、サンプリングされ推定された平均の信頼区間が95%であると言うとき、「実際の」値が境界の間にあることを95%確信しているとは言いません。この実験を何度も繰り返すことができれば、95%の時間で、平均が実際に境界の間にあることがわかります。しかし、1回の実行でそれを行う場合、精神的な近道を取り、「正しいと95%確信しています」と言っています。

最後に、実験に基づいた仮説検定の標準設定を忘れないでください。植物成長ホルモンが植物の成長を早めるかどうかを知りたい場合は、6か月の成長後に最初にトマトの平均サイズを決定することができます。その後、ホルモンを使用して繰り返し、平均サイズを取得します。私たちの帰無仮説は「ホルモンが機能しなかった」ことであり、それをテストます。しかし、テストされた植物が平均して99%の信頼度で大きい場合、それは「植物と、どれだけ正確に計量するかによって常にランダムな変動がありますが、これを説明するランダム性の量は1未満である」ことを意味します百の時間。」


1

この問題は、事前確率と事後確率の混乱として、または特定のランダム変数の共同分布を知らないことの不満として特徴付けることができます。

コンディショニング

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

証拠を条件付けしないということは、証拠を無視することを意味します。ただし、確率モデルで表現できるもののみを条件とすることができます。骨nからの2つのボールの例では、天気や今日の気分を調整することはできません。そのようなことが実験に関連する証拠であると信じる理由がある場合、最初にモデルを変更して、この証拠を正式なイベントとして表現できるようにする必要があります。

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

信頼区間

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ、この証拠を認めると同時にそれを無視することを意味します。

より多くを学び、より少なく知る

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

ニックスがxbar-2sd(x)とxbar + 2sd(x)の間で得点する確率が過去のあるゲームで約.95であると言えば、それはバスケットボールの得点の分布に関する特定の分布の仮定を与えられた合理的な声明です。ゲームのサンプルを与えられたスコアに関するデータを収集し、その間隔を計算すると、過去のある特定の日にその間隔で得点した確率は明らかに0または1であり、ゲーム結果をグーグルで調べることができます。頻度がゼロまたは1つの確率を維持するという唯一の概念は、繰り返しサンプリングに由来し、特定のサンプルの間隔推定の実現は、そのサンプルの間隔推定が行われたか、または与えられなかったマジックポイントです。 。パスワードを入力する場所ではありませんが、

これがディクランが上記で主張していることであり、私は彼の答えに賛成票を投じました。繰り返されたサンプルが考慮外のポイントは、上記の例のようにパスワードを入力したとき、または私の例の結果をグーグルで検索したときではなく、非離散確率が得られなくなる頻度主義パラダイムのポイントですニックスゲーム、ただしサンプル数が1のときのポイント。


0

モデリング

S=(Ω,Σ,P)EΣP(E)ESS

手順(1)により、多少の余裕が生じる場合があります。モデリングの妥当性は、特定のイベントの確率を直感的に予想されるものと比較することでテストできる場合があります。特に、特定の限界確率または条件付き確率を調べると、モデリングがどの程度適切かを知るのに役立ちます。

X1,,XnDist(θ)θR

信頼区間推定器

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

環境設定

γ1γ2γ1<γ2抽選された最初のチケットよりも勝ちチケットになる確率が高い。観測値を生成したランダムプロセスの確率的特性に基づいた、異なる観測値(この例では2つのチケット)に関する設定は問題ありません。チケットのいずれかが当選チケットになる可能性が高いとは言わないことに注意してください。私たちがそう言うなら、口語的な意味での「確率」で、それは何を意味する可能性があるので、ここでは避けるのが最善です。

0.95

単純な事前分布の例

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

「真のパラメーターがこの信頼区間にある確率」と言えば、サンプルのサイズは考慮されません。サンプルがどれほど大きくても、平均が同じである限り、信頼区間は等しく広くなります。しかし、「これを100回繰り返すと、95個のケースで真のパラメーターが間隔内に収まると予想される」と言うとき、サンプルサイズのサイズと、推定値。サンプルサイズが大きいほど、平均推定値の分散は小さくなります。したがって、それほど変化することはありません。手順を100回繰り返している場合、95のケースで真のパラメーターが間隔内にあることを確認するために大きな間隔は必要ありません。


信頼区間は頻繁な概念であることに注意してください。
マイケルチャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.