信頼区間と信頼区間が一致する場合の例


11

信頼できる間隔に関するウィキペディアの記事で、それは言う:

単一のパラメータと単一の十分な統計に要約できるデータの場合、未知のパラメータが位置パラメータである場合、信頼できる区間と信頼区間が一致することを示すことができます(つまり、前方確率関数はPr(x |μ)= f(x −μ))、事前分布は均一なフラット分布です; [5]また、未知のパラメーターがスケールパラメーターである場合(つまり、前方確率関数はPr(x | s)= f(x / s))、ジェフリーズの事前[5] —後者は、そのようなスケールパラメーターの対数を取ると、均一な分布を持つ位置パラメーターに変わるためです。しかし、これらは明らかに(特別ではありますが)特別なケースです。一般に、そのような同等性を作ることはできません。」

人々はこれの具体的な例を示すことができますか?95%CIが実際に「95%確率」に対応し、CIの一般的な定義に「違反」するのはいつですか?

回答:


13

正規分布:

分散が既知の正規分布をとります。一般性を失うことなく、この分散を1にすることができます(各観測値を分散の平方根で除算することにより)。これにはサンプリング分布があります:

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

ここで、はデータのみに依存する定数です。これは、標本平均が母集団平均に対して十分な統計であることを示しています。均一事前分布を使用する場合、事後分布は次のようになります。Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

したがって、信頼できる間隔は次の形式になります。1α

(X¯+1NLα,X¯+1NUα)

ここで、と標準正規確率変数のように選択される満たします:LαUαZ

Pr(Lα<Z<Uα)=1α

これで、信頼区間を構築するためのこの「重要な量」から始めることができます。固定されたに対するの標本分布は標準正規分布であるため、これを上記の確率に代入できます。N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

次に、を解くように再配置します。信頼区間は、信頼できる区間と同じになります。μ

スケールパラメータ:

スケールパラメータの場合、pdfの形式はです。を取ることができます。これは対応します。共同サンプリング分布は次のとおりです。p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

そこから、(観測値の最大値)に等しい十分な統計を見つけます。ここで、そのサンプリング分布を見つけます。Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

これで、を取ることで、これをパラメーターから独立させることができます。これは、「ピボタル量」がで与えられ、が分布であることを意味します。したがって、次のようなベータ変位値を使用してを選択できます。y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

そして、極めて重要な量を代入します:

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

そして、信頼区間があります。以前にジェフリーズを使用したベイジアンソリューションの場合:

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

次に、信頼区間を接続し、その信頼性を計算します

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

そしてプレスト、我々は信頼性とカバレッジを持っています。1α


傑作、ありがとう!「正規分布からサンプルの平均を計算するとき、95%のCIは実際には95%の信頼できる間隔でもある」のような答えがあるかと期待していました。(この想定される答えを構成するだけで、具体的な例についての手がかりはありません。)
Wayne

私は、頻出の95%予測/許容範囲間隔は、OLS回帰と通常のエラーを伴うベイズ予測間隔に対応すると考えています。とにかく、predict.lmの答えをシミュレートされた答えと比較すると、そのように見えます。本当?
ウェイン

あなたが均一前を使用する場合は、とする先行ジェフリーズ、あなたは等価性を持っています。α β σY=α+βXα,βσ
確率論的

まことにありがとうございます!私が行った回帰のCIを信頼区間の観点から説明しようとしましたが、信頼できる区間を期待する素人の聴衆とはつながりません。CIについての素人の誤解を助長するので、おそらくそれは全体的な統計の世界にとって悪いことですが、私にとって人生をはるかに楽にします。
ウェイン

@Wayne-ロケーションスケールファミリーよりも少し一般的な状況です。通常、CIが「十分な統計」(これら2つがそうであった)に基づいている場合、CIは信頼できる間隔に相当します。十分な統計がない場合、CIは「補助統計」と呼ばれるものを条件付けして、信頼できる間隔解釈を行う必要があります。
確率論的
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.