信頼区間を構築する基本的なロジック


7

対象のパラメーターとその点推定量を持つモデルを考えます。簡単にするために、と仮定 します(多くの場合、これは漸近的に正当化できます)。可能な限り最短レベルの信頼区間である区間を作成する方法は2つあります。θθ^θ^N(θ,σ2/n)(1α)

  1. 任意の真値に対して、Iは最短間隔たい有する捕捉の確率。、与えられた分布で最も密度の高い領域を選択し、その領域の累積確率がます。領域内のすべての点推定に対して、対応する間隔推定がをカバーするように、間隔推定器を定義します。 分布はどの真の値でも同じであるためθ(θ^lower,θ^upper)(1α)θθ^θf(θ^;θ)(1α)θ^θ
    θ^θは場所のシフトを除いて、間隔を構築するメカニズム(規則)は実際のとは無関係です。したがって、それは真のを確率でカバーします。θθ(1α)

  2. ポイントの推定を考慮して、どの真の値の下でが生成される可能性が高いかを検討しています。与えられた真の、のの分布を知っているので、最高の密度値を生成するを選択します。選択範囲を含めるだけに制限しますθ^θθ^θf(θ^;θ)θ値累積確率を持つ値に対して少なくとも極端な限り。つまり、θαθ値れる対応する関連付けられ-value少なくともある。θpθ^α

最初のアプローチは、その何でも本当の確保に直接焦点を当て、それが中に含まれているのインスタンスをサンプリングのシェア。最良の候補者のための第二のアプローチのルックス実現させるのおそらく、廃棄ながらの下そうです。2つの間の線(可能性とそうでない可能性)は、元の目標の観点からいくらか恣意的に描かれていますが、それはたまたま正しい線です。θ(1α)θθ^θθ^

間隔を構成するための2つのルールは、この簡略化された例では同じ答えを与えます。信頼区間の構築の正しい動機、または正しい考え方について、(2つのうちのいずれかである場合)
どれですか?
(おそらく、上記のの分布の仮定を削除すると、アプローチの1つが無効になり、一般に不適切であり、この例では偶然にしか正しい答えが得られないことがわかりますか?)θ^


ここであなたの動機は何ですか(もしあれば)?ほとんどの場合、それは非常に微妙な違いのようです。
Xiaomi 2018年

@Xiaomi、関心をお寄せいただきありがとうございます!2つのアプローチの結果は同じですが、それに到達する方法は明らかに非常に異なります(少なくとも私の認識です)。信頼区間推定のロジック(およびおそらく履歴)に忠実であり続けるには、どのようにすればよいのでしょうか。おそらく、方法の1つがたまにしか正しい答えを出さないでしょう。微妙に違いはあるかもしれませんが、かなり心配です。あなたはたまたま答えを知っていますか?
Richard Hardy

Martijn Weteringsの回答の後、私は2番目のアプローチが(前にフラットがある)信頼できる区間を構築する特別な場合かもしれないと考え始めています。θ
Richard Hardy

フラット前と信頼区間との信頼区間との違いについての関連質問 stats.stackexchange.com/questions/355109/... (彼らがいないと同じ、特に注目に値する信頼区間は、Aに対し、変数の変化に伴って変化しないことです信頼できる間隔(前の値を「フラット」にしたい場合に変更する必要がある場合)は同じままではありません)
Sextus Empiricus

第二の方法を説明する段落の最後の文「私は含まれるように選択...の値制限に関連付けられた対応するp値れる少なくともある」θθα非常に実際と同じであるが最初の方法。
Sextus Empiricus 2018年

回答:


5

100のベルヌーイ試行の例

信頼区間の構築は、次のように対プロットに配置できます。θθ^

帰無仮説ではなく、サンプリングを介して生成された信頼区間で帰無仮説を棄却できますか?

その質問に対する私の回答では、次のグラフを使用します。

信頼区間

この画像は古典的であり 、二項 CJクロッパーとESピアソンバイオメトリカVol。26、No。4(1934年12月)、404-413ページ

次の2つの方法で%信頼領域を定義できます。α

  • 垂直方向 では、データ、パラメーターが本当にであることを条件として、これらの境界内に入る確率はです。L(θ)<X<U(θ)Xθα

  • 水平方向 では、信頼区間内に実験が真のパラメーターを持つ確率は%です。L(X)<θ<U(X)α


二方向の対応

したがって、重要な点は、間隔と間隔間に対応があることです。これが、2つの方法の出所です。L(X),U(X)L(θ),U(θ)

とをできるだけ近づけたい場合("最短()レベルの信頼区間")は、領域全体の面積をできるだけ小さくしようとしています、これは、とを可能な限り近づけることに似ています。(多かれ少なかれ、可能な限り最短の間隔を取得するユニークな方法はありません。たとえば、あるタイプの観測の間隔を、別のタイプの観測犠牲にして短くすることができます)L(X)U(X)1αL(θ)U(θ)θ^θ^


実施例θ^N(μ=θ,σ2=1+θ2/3)

最初の方法と2番目の方法の違いを説明するために、2つの方法異なる場合があるように例を少し調整ます。

ましょう一定ではないが、その代わりと何らかの関係有するσμ=θ

θ^N(μ=θ,σ2=1+θ2/3)

その後の確率密度関数、上の条件 ISθ^θ

f(θ^,θ)=12π(1+θ2/3)exp[(θθ^)22(1+θ2/3)]

および関数としてプロットされたこの確率密度関数想像してください。f(θ^,θ)θθ^

例

凡例:赤い線は信頼区間の上限であり、緑の線は信頼区間の下限です。(約68.3%)の信頼区間が描画されます。黒い太線は、と。±1σ(θ,θ^)=(3,1)(θ,θ^)=(0,1)

PDF(一定の左から右への方向で)私たちは観察用のPDFを持っている与え。これらの2つが投影されています(平面)。値の境界(最も高い密度の領域になるように選択された)は、単一のpdfの同じ高さにありますが、異なるpdfの同じ高さではないことに注意してください(高さは値を意味します) of)θθ^θθ=7pp<1αf(θ^,θ)

尤度関数上から下への方向(定数)では、観測値与えられた尤度関数があります。これらの1つが右側に投影されています。θ^θθ^

この特定のケースでは、定数に対して最も高い密度の68%質量を選択すると、定数に対して最も可能性の高い68%質量を選択した場合と同じ結果になりませθθ^

信頼区間の他のパーセンテージの場合、 1つまたは両方の境界があり、区間は2つのばらばらの断片で構成される場合もあります。そのため、尤度関数の密度が最も高い場所は明らかにありません(方法2)。これはどちらかと言えば人工的な例です(ただし、これらの多くの詳細がどのように表示されるかは簡単でいいです)が、より一般的なケースでは、2つの方法が一致しないことが簡単にわかります(信頼区間と信頼区間の例を参照してください)平坦な事前分布は、指数分布の速度パラメーターについて比較されます。±

2つの方法は同じですか?

この水平と垂直の結果は、プロットの間隔を区切る境界とが同じ場合の結果です。 vsは、等値線です。境界が2つの方向のどちらよりも同じ高さにある場合は、改善を加えることができます。ULθθ^f(θ^;θ)

(これとは対照的:を有する例では信頼区間境界はますない同じ値であっても、異なる場合、確率質量がより広くなるため、密度が低くなり、大きくなります。これにより、とは、同じ値、少なくともいくつかの場合、これは、与えられた最も高い密度を選択しようとする方法2と矛盾しますθ^N(θ,1+θ2/3)f(θ^,θ)θ|θ|θlowθhighf(θ^;θ)θ^f(θ^;θ)θ^。上の画像では、値の信頼区間の境界に関連する2つのpdf関数をプロットすることで、これを強調しようとしています。これらの境界では、pdfの値が異なることがわかります。) θ^=1

実際、2番目の方法は完全に正しくないようです(これは、信頼区間よりも尤度区間または信頼区間の一種です)、水平方向の%密度(境界%尤度関数の質量)その後、事前確率に依存する場合があります。αα

正規分布の例では、これは問題ではなく、2つの方法は一致しています。実例については、Christoph Hanckのこの回答も参照してください。境界は等値線です。を変更すると、関数はシフトのみを行い、「形状」は変更しません。θf(θ^,θ)

基準確率

境界が垂直方向に作成されるときの信頼区間は、事前確率とは無関係です。これは、2番目の方法には当てはまりません。

第1と第2の方法のこの違いは、基準確率と信頼区間の微妙な違いの良い例です。


良い点。私は、いくつかの事前確率が2番目のアプローチに潜入しようとしているのではないかと疑っていました...
Richard Hardy

私はいくつかのより良い視覚表現を思い付くことができるかどうかを試してみます。を表面としてプロットすると、いくつかの尾根形状が得られますが、Bernouilli試行の場合、その形状はエッジで小さく、高くなっています。正規分布の場合、より対称的です。f(θ^;θ)
Sextus Empiricus

それ(新しい視覚的表現)は大いに役立つかもしれません!また、あなたは上の手の込んだ可能性が確率密度関数を想像用条件付きでプロットで2D対f(θ^;θ)θ^θθθ^?なんとなく言い換えてもらえますか?私はこれを理解するのに苦労しており、その結果、残りの部分での横対縦の意味は何ですか。おそらく、「方向」を水平方向に、「方向」を垂直方向に付けるなどの名前を付けることができます(そうでない場合は、どちらか正しい方)。θθ^
Richard Hardy

その写真を追加したいと思います。現在の画像に似ています。私たちは通常見るf(θ^;θ)関数として固定されているが、我々は、関数にそれを変更することができとない固定。次に、信頼区間を作成するときに、垂直()方向に質量の%を境界とする境界とを作成します。すべてのに対してこれを行うので、2D画像には、質量の%を含む境界があります。他の方向で同じことを想像することができます(しかし、それは異なります)。θf(θ^,θ)θ L(θ)U(θ)θ^αθα
Sextus Empiricus

1
@whuber画像はかなり古く、私はここから画像を使用しましたjstor.org/stable/2331986 二項CJクロッパーとESピアソンバイオメトリカVol。26、No。4(1934年12月)、pp。404-413 (そして、質量の95%が得られるようにエリアを選択するという考えは正しくないことに同意します。これらのリージョンの1つだけが信頼につながります。間隔の問題は、「可能な限り最短の間隔が欲しい」という質問のステートメントにある可能性があります。これはあいまいです。これを取得する一意の方法はありません。)
Sextus Empiricus
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.