正確には、信頼区間とは何ですか?


86

信頼区間とは何かを大まかに非公式に知っています。しかし、かなり重要な詳細に頭を包み込むようには思えません。ウィキペディアによると:

信頼区間は、実際に取得されたデータが与えられた場合、パラメーターの真の値が信頼区間にある特定の確率を持っているとは予測しません。

また、このサイトのいくつかの場所で同様の指摘がありました。ウィキペディアからのより正確な定義は次のとおりです。

繰り返された(および場合によっては異なる)実験の多くの別個のデータ分析にわたって信頼区間が構築される場合、パラメーターの真の値を含むそのような区間の割合は、信頼レベルとほぼ一致します。

繰り返しになりますが、私はこのサイトのいくつかの場所で同様の指摘をしました。わかりません。繰り返し実験の下で、真のパラメーターを含む計算された信頼区間の割合がである場合、実際の実験で計算されたが信頼区間にある確率は?私は答えで次を探しています:1 - α θ 1 - α θ(1α)θ(1α)

  1. 上記の誤った定義と正しい定義の区別の明確化。

  2. 最初の定義が間違っている理由を明確に示す、信頼区間の正式で正確な定義。

  3. 基礎となるモデルが正しい場合でも、最初の定義が劇的に間違っている場合の具体例。


4
この投稿には、信頼区間の問題に関する良い議論がありますstats.stackexchange.com/questions/2356/…。ポストで言及された記事は、上記の定義が信頼区間に対して正しい理由を正確に明らかにするのに役立つと思います。CIがどのように分解されるかを見ると、CIをよりよく理解できることがよくあります。
確率

2
私の一部は質問に拍手を送ります(+1)。競合する部分は、1を指摘したいと思います。統計消費者の大多数は、統計を実用的であるが哲学的ではなく化学的または市場調査に使用する人々は、問題の良さを決して理解しないでしょう。結果を説明するために迷っている。2.一部の純粋主義の統計学者でさえ、ランダムなサンプルを扱っていないときに信頼区間を含むような、おそらく確率的なステートメントを作成するというtrapに陥ることがあります。より大きな問題。
rolando2

3
@マリオあなたの仮定は真実ではありません!実験の100回の繰り返しのうち、95個のCI(平均ではない)が真の(ただし未知の)平均を含むと予想されます。CIはランダムですが、真の母平均はそうではありません。
whuberの

6
Cumming&Maillardet(2006)による素晴らしい論文には、複製手段の95%が元のCIに分類されるのではなく、83.4%のみであることが示されています(この値を「キャプチャ率」と呼びます)。その理由は、変動の原因は2つあるということです。A)周囲の元の平均の変動mu、およびB)周囲の複製平均の変動mu。ほとんどの人はAを忘れます:元のCIは必ずしも構築されていませんmu
フェリックスS

2
興味のある読者はこのスレッドを見たいかもしれません:95%CIが95%の平均を含む可能性を意味しないのはなぜですか?
GUNG

回答:


26

この思考実験は、信頼区間について考えるときに役立つことがわかりました。また、あなたの質問に答えます3。

ましょ及び。観測値およびに対応する値およびをとる 2つの観測値を考え、およびます。次に 50%信頼区間である(間隔が含まれているのであればまたは、それぞれ有しているの確率)。Y = X + A - 1XU(0,1)Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)[ y ly u ] a a x 1 < 1yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

ただし、場合、区間にが含ま確率はではなくであることがます。微妙な点は、パラメーターの信頼区間は、区間の端点(確率変数)が、パラメーターの確率ではなく、区間を計算する前に確率パラメーターの両側にあることを意味することです間隔を計算した後、間隔内にあるのはです a11yuyl>12a1 zzz12z%z% z%


3
ほぼ確実でことに注意してください。したがって、区間 は、確率ゼロのパラメーターが含まれます。実際、推定しているものが場合、引数は機能します。[ YのLY 、U ] θ = A + 1Y>a[yl,yu]aθ=a+12
でした

4
を後、区間にが含まれる確率が1であることがわかっているだけなので、このカウンターの例は有効ではないと思います。追加情報を取得した後、確率が変化することは完全に合理的です。間隔が50%の信頼区間であることだけがわかっていた場合、確率は1/2になります(ただし、長期実行頻度のない特定のイベントに適用されるため、頻度が高くないベイズ確率になります)θyuyl>1/2
ディクランマースピアル

1
それは確かに良い例ですが、私は強く何とか変え確率についてのあなたの声明に反対する前の信頼区間を計算します。それは意味をなさないし、数学はどういうわけかあなたが知っていることとしないことを気にするという印象を与える。ありません!!。あなたは常にこと有しである。また、常に持っているである。それは矛盾ではなく、1つは単に無条件の確率であり、もう1つは条件付きの確率です。1P(a[yl,yu]) P[YのLY、U]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp、はい、おそらく、テイラーが確率の変化について語っているのは不十分な表現です。確率は変わりません。引数が示しているのは、CIの誤った理解が論理的な問題につながることを示す状況がどのように発生しやすいかです。観察するCIが正しい可能性が50%あると信じているが、正しくない可能性がある場合は、CIが間違っていると理解しています。
ジョン

36

信頼区間に関しては多くの問題がありますが、引用に注目しましょう。問題は、正確性の問題ではなく、誤解の可能性にあります。「パラメーターには特定の確率がある」と言うとき、パラメーターはランダム変数であると考えています。これは、(古典的な)信頼区間手順の観点ではありません。この手順では、ランダム変数が区間自体であり、パラメーターはランダムではなくまだ決定されています。これが、こうしたステートメントが頻繁に攻撃される理由です。

数学的には、データをパラメータ空間のサブセットにマッピングするプロシージャをとし、(パラメータ値に関係なく)アサーションはイベントを定義し、定義により、それは確率いずれかの可能な値のための。とき自信を持って信頼区間の手順であるのこの確率は(すべてのパラメータ値を超える)infimumを持つようになっているx = x iθtx=(xi)θA XのPr θA X θ T 1 - α 1 - αθt(x)A(x)Prθ(A(x))θt1α1α。(この基準に従って、通常、短い信頼区間や対称なものを生成するなど、いくつかの追加のプロパティを最適化する手順を選択しますが、それは別の問題です。)次に、大きな数値の弱法則が2番目の引用を正当化します。ただし、それは信頼区間の定義ではなく、単に所有している特性です。

この分析は質問1に答えたと思うので、質問2の前提が間違っていることを示し、質問3の意味がなくなっています。


3
素晴らしい質問に答えてくれてありがとう。さらに議論するために、次の例えを取り上げてもいいですか?公正なコインを何度もひっくり返すと仮定します。次に、。さて、コインを1回ひっくり返しますが、私がひっくり返したものを見せないで、「頭が上がる確率はどれくらいですか?」と尋ねます。その質問にどう答えますか?P(Head)=.50
ヴォルフガング

3
別の言い方をすれば、非ベイジアンにとって、確率を持つことができる唯一の「もの」は可能なイベントです-ランダム実験の将来の結果の意味で。パラメーターに固定された真の値がある場合、特定の値を持つ間隔を取得すると、パラメーターが間隔に含まれるかどうかにかかわらず、それは起こりうるイベントではなくなります。その結果、間隔を生成するプロセスに自信を持つことができますが、2つの特定の数値には自信がありません。
カラカル

1
@caracal-ちょっと考えてみると、「コインフリップ」は本当に「ランダム」ですか?「はい」と言うと、硬貨が頭に浮かぶかどうかは多くの事柄(風、高度、力とフリップの角度、硬貨の重量など)の決定論的(しかし複雑な)関数であるという考えを拒否します。 。)。これは、CIベースの思考に適用される「ランダム性」の二重基準を示していると思います。データは固定されていますが、その値については不確かです(エルゴデータはランダムです)。パラメーターは固定されていますが、その値については不確かですエルゴパラメータはランダムではありません)。
確率

4
@Wolfgangあなたの例が信頼区間にどのように関係するかわかりません。分布パラメーターに関連するものは求めません。あなたの状況は、予測間隔と最も密接に関連しています。 私はこの議論全体がその文脈にある程度の関心を持っていると思いますが、信頼区間に関するスレッドに属していません。
whuber

2
@whuber特定の95%CIについて真の未知のパラメーターをキャプチャする確率ステートメントを作成できるかどうかという質問は、結果がまだ不明である特定のフリップについて確率ステートメントを作成できるかどうかという質問に非常に似ています。長期的には、CIの95%がパラメーターをキャプチャします。長い目で見れば、フリップの50%はヘッドです。特定のCIがパラメーターをキャプチャする可能性が95%あると言えますか?見る前に頭が上がる可能性は50%あると言えますか?私は両方にイエスと言うでしょう。しかし、一部の人々は同意しないかもしれません。
ヴォルフガング

19

CIの定義を間違っているとは言いませんが、確率の定義が複数あるため、CIを誤って解釈するのは簡単です。CIは、以下の確率の定義に基づいています(頻度論者またはオントロジー)

(1)命題の確率=命題が真であると観察される時間の長期実行割合、データ生成プロセスを条件とする

したがって、CIの使用において概念的に有効であるために、この確率の定義を受け入れる必要あります。そうしないと、理論的には間隔はCIではありません。

これが、確率の「長期実行」定義が使用されていることを明確にするために、定義が単語確率ではなく単語割合を使用した理由です。

確率の主な代替定義(演pi的論理またはベイジアンの拡張としての認識論的または確率)は、

(2)命題の確率=命題が真実であるという合理的な信念の程度、知識の状態を条件とする

人々はしばしばこれらの定義の両方を直観的に混同し、直感に訴えるために解釈を使用します。これにより、あらゆる種類の混乱する状況に陥ります(特に、あるパラダイムから別のパラダイムに移行する場合)。

2つのアプローチがしばしば同じ結果をもたらすことは、場合によっては次のことを意味することを意味します。

命題が真であるという合理的な信念、知識の状態を条件とする=命題が真であると認められる時間の長期的割合、データ生成プロセスを条件とする

要点は、それが普遍的に成り立たないということであるため、2つの異なる定義が常に同じ結果をもたらすとは期待できません。したがって、実際にベイジアン解を計算してから同じ間隔であることがわかった場合を除き、CIによって指定された間隔に、真の値を含む確率としての解釈を与えることはできません。また、その場合、間隔は信頼間隔ではなく、信頼できる間隔になります。


2
定義1による命題の確率がなぜ有理数でなければならないのかわかりません。長期的な割合は、命題が真実であると観察されるような時間の割合の制限を指しているようです。各割合は有理数ですが、その制限はそうではないかもしれません。(幸いなことに、あなたのこの括弧は、あなたの答えの残りの部分にせいぜい接線ようです。)
でした

3
@probabilityこの返信は、あまり建設的ではない方法で接線を離しているようです。確率と割合を等しくすることは、温度を温度計の水銀レベルと同一視するようなオントロジーの混乱の形式です。1つは理論的な構造であり、もう1つはそれを測定する物理現象です。これについては、stats.stackexchange.com / questions / 1525 /…で議論されています
whuberの

@Didier-あなたは正しい、実際にはのシーケンス、これは無理の制限がある合理的な用語です。この発言は削除しました。これを持ってきてくれてありがとう。xn=r2xn1+xn12r
確率論的

6
@whuber-人々が間違った方法でCIを解釈するように導くのはまさにこの誤解であるため、指摘することが重要です。「信念の合理的な程度」と混同する確率は、頻繁なパラダイムと一致しません。これは、CIを取得して「真の値が間隔内にある確率」を意味する場合に発生することです。これは、質問で@dsimchaが行っていることです。
確率論的

1
@確率説明をありがとう。あなたの返事は、「確率=割合」の定義と一致していると理解していました。実際、あなたのコメントがこれを誤解として特徴付けているとしても、綿密な再読により、これが第3段落であなたが言っていることであることが示唆されています。この点を明確にすることをお勧めします。
whuber

6

RAフィッシャーは、信頼区間の有用性の基準を持っていました。CIは、異なる信頼レベルを意味する「識別可能なサブセット」を認めるべきではありません。ほとんどの(すべてではないにしても)反例では、カバレッジ確率が異なる識別可能なサブセットがある場合があります。

これらの場合、ベイズの信用区間を使用して、パラメーターの主観的な感覚を指定するか、データに基づいてパラメーターの相対的な不確実性を反映する尤度間隔を定式化できます。

たとえば、比較的矛盾がないと思われるケースの1つは、母平均の両側正規信頼区間です。与えられた標準の標準母集団からのサンプリングを想定すると、95%CIは、パラメーターに関する詳細情報を提供する識別可能なサブセットがないことを認めます。これは、サンプル平均が尤度関数で十分な統計量であるという事実からわかります。つまり、尤度関数は、サンプル平均がわかれば、個々のサンプル値に依存しません。

通常の平均の95%対称CIに主観的な信頼がある理由は、指定されたカバレッジ確率からではなく、通常の平均の対称95%CIが「最尤」区間であるという事実から生じます。間隔内のパラメーター値は、間隔外のパラメーター値よりも高い可能性があります。ただし、尤度は(長期的な精度の意味での)確率ではないため、より主観的な基準です(事前および尤度のベイジアン使用と同様)。要するに、95%のカバレッジ確率を持つ正規平均には無限に多くの間隔がありますが、対称CIのみが間隔推定から予想される直感的な妥当性を持っています。

したがって、RA Fisherの基準は、これらの識別可能なサブセットが認められない場合にのみ、カバレッジ確率が主観的信頼度と同等であることを意味します。サブセットが存在する場合、カバレッジの確率は、サブセットを記述するパラメーターの真の値を条件とします。直感的な信頼レベルで間隔を取得するには、サブセットの識別に役立つ適切な補助統計に基づいて間隔を条件付ける必要があります。または、分散/混合モデルに頼ることができます。これは、パラメーターをランダム変数(別名ベイジアン統計)として解釈することに自然につながるか、尤度フレームワークの下でプロファイル/条件/限界尤度を計算できます。いずれにせよ、客観的に検証可能な正確さの可能性を思い付く希望を放棄しましたが、

お役に立てれば。


1
(+1)対称ノーマルCIを正当化する1つの方法は、予想される長さを最小化することです。最終的には、決定手順における損失関数としての長さの選択に主観を押し戻すだけですが、それは間違いなく「良い」種類の主観です(なぜなら、それは統計手順の選択における分析目的の役割を明らかにするからです) 「悪い」主観性。軽pe的な言い回しのように聞こえます。
whuber

5

理論的な観点から、質問2と3は、定義が間違っているという誤った仮定に基づいています。そのため、その点で@whuberの回答に同意し、質問1に対する@whuberの回答には追加の入力は必要ありません。

ただし、より実用的な観点から、同じ情報に基づくベイジアンの信頼区間と数値的に同一である場合(つまり、情報のない事前分布)、信頼区間に直感的な定義(真の値を含む確率)を与えることができます。

しかし、これはダイベイのハードな反ベイジアンにとってややがっかりです。なぜなら、CIに与えたい解釈を与える条件を検証するためには、直観的な解釈が自動的に成立するベイジアンソリューションを解決しなければならないからです。

最も簡単な例は、既知の分散持つ正規平均の信頼区間、および事後信頼区間。1α1-α ¯ X ±σZα / 2x¯±σZα/21αx¯±σZα/2

条件は正確にはわかりませんが、CIを直感的に解釈するには、以下が重要であることを知っています。

1)分布がパラメーターに依存しないピボット統計が存在します(正確なピボットは正規分布およびカイ二乗分布の外側に存在しますか?)

2)迷惑パラメータはありません(CIを作成するときに迷惑パラメータを処理する必要がある数少ない正確な方法の1つであるPivotal統計の場合を除きます)

3)目的のパラメーターに対して十分な統計が存在し、信頼区間では十分な統計が使用されます

4)十分な統計量のサンプリング分布と事後分布は、十分な統計量とパラメーターの間で何らかの対称性を持っています。通常の場合、サンプリング分布の対称性は、。μ|¯XσN¯Xσ(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

これらの条件を見つけるのは通常困難であり、通常はベイジアン間隔を計算して比較する方が速いです。興味深い演習は、「私のCIも信頼できる間隔である前に何のために?」という質問に答えることです。これを事前に確認することにより、CI手順に関するいくつかの隠れた仮定を発見することができます。


1
(+1)「反ベイジアン」のような人は本当にいるのですか?:-)
whuber

6
@whuber 1つです。そして、統計学の哲学における奨学金で彼女と協力している計量経済学者がいます。
シアン

1
ありがとう!それは、私が気付いていなかった確率と統計の哲学において非常に興味深いスレッドです。
whuber

1
を欠落していると間違えましたか?x¯±zα/2σnn
qazwsx

3

これは理解するのが難しいかもしれないものです:

  • すべての信頼区間の平均95%にパラメーターが含まれる場合
  • 特定の信頼区間が1つあります
  • この間隔にパラメーターが含まれる確率も95%ではないのはなぜですか?

信頼区間は、サンプリング手順に関連しています。多数のサンプルを取得し、各サンプルの95%信頼区間を計算する場合、それらの区間の95%に母平均が含まれていることがわかります。

これは、たとえば工業品質部門に役立ちます。それらの人は多くのサンプルを取り、今では彼らの推定値のほとんどが現実にかなり近いと確信しています。彼らは、推定値の95%がかなり良いことを知っていますが、個々の推定値についてそれを言うことはできません。

これをローリングサイコロと比較します。600(フェア)のサイコロを振る場合、6を振りますか?最良の推測は * 600 = 100です。16

ただし、ダイスを1つ投げた場合、「6を投げた確率は1/6または16.6%です」と言うのは無意味です。どうして?ダイには6または他の数字が表示されるためです。あなたは6を投げたかどうか。したがって、確率は1または0です。確率をすることはできません。16

投げる前に、サイコロを1つ振って6を投げる確率を尋ねると、ベイジアンは「」と答えます(事前情報に基づいて、誰もがサイが6面で平等なチャンスがあることを知っています)ただし、頻度はデータにのみ基づいており、事前情報や外部情報に基づいているわけではないため、フリークエンティストは「考えない」と言います。16

同様に、サンプルが1つしかない場合(つまり、信頼区間が1つ)、母平均がその区間内にある可能性を示す方法はありません。平均(または任意のパラメーター)は、その中にあるかどうかです。確率は1または0です。

また、信頼区間内の値がそれ以外の値よりも高い可能性があることは正しくありません。小さなイラストを作りました。すべては°Cで測定されます。水は0℃で凍結し、100℃で沸騰します。

ケース:冷たい湖で、氷の下を流れる水の温度を推定したいと思います。100箇所の温度を測定します。私のデータは次のとおりです。

  • 0.1°C(49箇所で測定);
  • 0.2°C(49箇所でも);
  • 0°C(1箇所で。これはちょうど凍結しようとする水でした);
  • 95°C(ある場所には、湖に非常に熱い水を不法に投棄する工場があります)。
  • 平均温度:1.1°C;
  • 標準偏差:1.5°C;
  • 95%-CI:(-0.8°C ...... + 3.0°C)。

この信頼区間内の温度は、それ以外の温度よりも確実に高くなることはありません。この湖の流れる水の平均温度は0°Cより低くすることはできません。そうしないと、水ではなく氷になります。この信頼区間の一部(つまり、-0.8から0までのセクション)には、実際に真のパラメーターが含まれる確率0%です。

結論として、信頼区間は頻繁な概念であるため、繰り返しサンプルの概念に基づいています。多くの研究者がこの湖からサンプルを採取し、それらすべての研究者が信頼区間を計算する場合、それらの区間の95%に真のパラメーターが含まれます。しかし、1つの信頼区間に対して、真のパラメーターが含まれている可能性を示すことは不可能です。


1
頻繁な統計は、事前の信念を持ち、それらを更新する頻繁な人と信念を測定しないという事実を混同しないでください。違いは、頻度主義者がデータ以外の知識を持たないバカであるかどうかではなく、頻度主義統計が信念状態の直接的な尺度を提供するかどうかです。頻度の高い人は、テストやCIなどに基づいて信念を更新する必要があります。そうしないと、すべてが決定に依存するため、システム全体が機能しません。
ジョン

2

さて、古典的な周波数法を使用してパラメーターの95%信頼区間を計算する場合、パラメーターがその区間内にある95%の確率があることを意味するわけではないことを理解しています。それでも...ベイジアンの観点から問題にアプローチし、パラメーターの95%の信頼できる間隔を計算すると、従来のアプローチを使用して取得したのとまったく同じ間隔が得られます(情報量の少ない事前確率を想定)。したがって、古典的な統計を使用して(たとえば)データセットの平均の95%信頼区間を計算すると、パラメーターがその区間にある確率は95%であるというの事実です。


5
頻繁な信頼区間とベイジアン信頼区間を使用して同じ結果が得られるかどうかは、問題、特にベイジアン手法で使用される事前分布に依存します。また、数学と科学では、正しいときに正しい理由で正しいことも重要です!
ディクラン有袋類

4
「[パラメータ]の95%信頼区間を計算するために従来の統計を使用する」場合、一貫して推論している場合、「パラメーターがその区間にある確率」を参照することは意味がありません。その確率に言及した瞬間に、状況の統計モデルを変更しました。パラメーターがランダムである新しいモデルでは、頻出法を使用してCIを計算するのは正しくありません。いくつかの状況でこの方法で正しい答えを得るのは興味深いですが、その根底にある概念的な混乱を正当化するものではありません。
whuber

4
@whuber-あなたの前提 "...一貫して推論しているなら..."は古き良きコックスの定理から結果をもたらします。あなたが一貫して推論しているなら、あなたの解数学的にベイジアンのものと同等でなければならない、と言います。そのため、この前提を考えると、CIは必然的に信頼できる間隔と同等になり、確率としての解釈は有効な間隔になります。そして、ベイズでは、分布を持つパラメーターではなく、分布を持つパラメーターに関する不確実性です。
確率論的

2
...続き...だから、私はベイジアンだというばかげたゲームをプレイできます...、私は頻度主義者、...、私はベイジアン人です...、私は頻度主義者です.....その間、実際の計算の数値は決して変化しません
確率

2

あなたは周波数主義者の信頼区間について尋ねています。定義(2つの引用はいずれも定義ではないことに注意してください!どちらも正しいステートメントだけです):

この実験を何度も繰り返した場合、このパラメーター値を使用したこの近似モデルを考えると、実験の95%でパラメーターの推定値はこの間隔内に収まります。

したがって、モデル(観測データを使用して構築)とその推定パラメーターがあります。その後、このモデルとパラメーターに従っていくつかの仮想データセットを生成した場合、推定パラメーターは信頼区間内に収まります。

実際、この頻繁なアプローチでは、モデルと推定パラメーターを与えられたとおりに固定し、他の多くの可能なデータのランダムなサンプルとしてデータを不確実なものとして扱います。

これは解釈するのは本当に難しいですし、これは多くの場合、ベイズ統計(のための引数として使用され、私は時々少し疑わしいことができると思います。一方、ベイズ統計は不明として固定し、扱いパラメータとして、あなたのデータを取る。ベイズ信頼できる区間があります予想どおり、実際には直感的です。ベイジアンの信頼できる間隔は、実際のパラメーター値が95%の間隔です。

しかし、実際には、ベイジアンの信頼できる区間と同じように、多くの人が頻繁な信頼区間を解釈し、多くの統計学者はこれを大きな問題とは考えていません。また、実際には、ベイジアンの情報価値のない事前分布を使用する場合頻度主義者とベイジアンの信頼性/信頼できる間隔に大きな違いはありません


-1あなたの「定義」は、少なくとも1回は読んでいる限り、間違っているようです。 CIをカバーするために構築された、真の確率でパラメータ。特定のモデルやパラメーターの適合方法に条件はありません。おそらく、定義を誤解しているのかもしれません。「このパラメーター値を持つこの適合モデル」を使用して、パラメーターの現在の推定値を参照します。それが意図したものではない場合、おそらくこの点を明確にできますか?1 - α1α1α
whuber

@ whuber、OK、私はそれを受け入れますが、私の定義が間違っていると言ったら、CIとは何かの完全な定義を投稿してください。
好奇心が

私は自分のコメントTomasを明確にしました。なぜなら、それは私に起こるので、あなたが意図しない方法であなたの定義を読んでいるかもしれません。Kiefer、Introduction to Statistics Inferenceは、「[[]]実験の結果は ... [S]推定にプロシージャを使用し、は ... [T] ..数は手続き信頼係数と呼ばれます...はaと呼ばれますXt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)tt信頼区間。"
whuber

@whuber、あなたの定義は私にとって本当に理解できず、私はほとんどの人にとっても怖いです:)そして、はい、私は現在の推定値を意味しました。頻度が高いので与えられたパラメータ推定値を取得し、データはベイジアンの反対です。
好奇心が

3
Curiousの定義の主な問題は、「...パラメータの推定値が間隔内に収まること」だと思います。これは推定パラメータではなく、未知の固定パラメータです。間隔内に収まらず、むしろ間隔が移動し、時間の95%がパラメーターをキャプチャします。
ジョン14

2

単純な状況にあるとします。不明なパラメーターと、1(非公式)の周りに不正確な推定器があります。(非公式に)は最も頻繁にあるはずだと思います。θTθθ[T1;T+1]

実際の実験では、を観察します。T=12

「私が見たものを与えられたら()、確率何ですか?」という質問をするのは自然です。数学的に:。誰もが当然この質問をします。信頼区間理論は、この質問に論理的に答えるべきです。しかし、そうではありません。T=12θ[11;13]P(θ[11;13]|T=12)

ベイジアン統計はその質問に答えます。ベイジアン統計では、実際に計算できます。ただし、実験を行ってを観察する前に、分布である事前分布を仮定する必要があります。例えば ​​:P(θ[11;13]|T=12)θT

  • の事前分布は一様であると仮定しθ[0;30]
  • この実験を行い、見つけますT=12
  • ベイズの式を適用します:P(θ[11;13]|T=12)=0.94

しかし、頻繁な統計では、事前情報がないため、ものは存在しません。代わりに、統計学者は次のように言います。「が何であれ、の確率は」数学的に: "P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

そう :

  • ベイジアン: for、T = 12P(θ[T1;T+1]|T)=0.94T=12
  • 頻度:θ,P(θ[T1;T+1]|θ)=0.95

ベイジアンの声明はより自然です。ほとんどの場合、頻繁な声明は、ベイズの声明として自発的に誤解されます(何年も統計を実践していない正常な人間の脳による)。そして正直なところ、多くの統計の本はその点をあまり明確にしていない。

そして実際には?

多くの通常の状況において、事実は、頻繁なアプローチとベイジアンのアプローチによって得られる確率が非常に近いということです。したがって、ベイジアンに対する頻繁な発言を混乱させることは、ほとんど結果をもたらさない。しかし、「哲学的に」それは非常に異なっています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.