信頼できる地域とベイジアン仮説検定の関係は何ですか?


38

頻繁な統計では、信頼区間とテストの間には密接な関係があります。約推論使用におけるN μ σ 2一例として分布を、1 - α信頼区間 ˉ X ± T α / 2N - 1 S / μN(μ,σ2)1α は、有意水準αt検定によって拒否されないμのすべての値が含まれます。

x¯±tα/2(n1)s/n
μtα

この意味で、頻繁な信頼区間は逆のテストです。(ちなみに、私たちは解釈できることを、この手段の最小値として-値αパラメータのNULL値が含まれるであろうために1 - α。信頼区間は、私は、これは何を説明するのに便利な方法であることができることを見つけますp値は、実際には少しの統計を知っている人向けです。)pα1αp

ベイズの信頼できる領域の決定理論的基礎について読んで、私は信頼できる領域とベイズのテストの間に同様の接続/同等性があるかどうか疑問に思い始めました。

  • 一般的な接続はありますか?
  • 一般的な接続がない場合、接続がある例はありますか?
  • 一般的な接続がない場合、どのようにこれを見ることができますか?

私が疑問に思っていた関連する質問-誰かが、おもちゃの例ではなく、実際の問題で使用されるベイズ仮説検定の「ゴールドスタンダード」または「標準的な例」であると考える論文を指摘できますか?ベイジアン仮説検定を本当に理解したことは一度もないし、その使用法の良い例が見つかると思う。
パトリックカルドン

2
@PatrickCaldonベイジアン仮説検定は意思決定理論の枠組みで定式化されているため、これについて「黄金の論文」があるとは思わない(したがって、単一の論文で捉えるには幅が広すぎる)。MånsTの回答で言及された本は良い資料を提供しますが、Bergerの本や講演も興味深いかもしれません。

論文ba.stat.cmu.edu/vol03is01.phpは、ここでの議論のほとんどを明確にすることができると思います。
カルロスABペレイラ

ありがとう、@ Carlos!リンクは現時点では機能していないようですが、SternとWechslerによるベイジアン分析の2008年の論文につながると思います。非常に興味深い読み物であることがわかりました!
MånsT

DearMånsT:Bayesian AnalysisはProject Euclidに移行しました。カルロス教授の論文はこちら:projecteuclid.org/…–

回答:


19

接続が存在するを見つけることができまし。損失関数の選択と複合仮説の使用に大きく依存しているようです。

一般的な例から始め、その後に正規分布を含む簡単な特別なケースが続きます。

一般的な例

未知のパラメータについて、聞かせてΘは、パラメータ空間であることとの仮説を検討θ Θ 0代替対θ Θ 1 = Θ Θ 0をθΘθΘ0θΘ1=ΘΘ0

してみましょうで表記を使用して、テスト関数である西安ザ・ベイズの選択我々は拒否しそうということ、(ソート私は、少なくともに使用されていますどのように後方のある)Θ 0を場合はφ = 0と受け入れΘ 0を場合φ = 1。損失関数の検討 L θ φ = { 0 もし  φ = I Θ 0θ )、0を場合  θ ΘφΘ0φ=0Θ0φ=1 ザベイズ試験は、次にであるφπX=1

L(θ,φ)={0,if φ=IΘ0(θ)a0,if θΘ0 and φ=0a1,if θΘ1 and φ=1.
φπ(x)=1ifP(θΘ0|x)a1(a0+a1)1.

取る0 = αを0.51 = 1 - αを。帰無仮説Θ 0があれば受理されるP θ Θ 0 | X 1 - αa0=α0.5a1=1αΘ0P(θΘ0|x)1α

今、信頼領域例えば、その領域であるP ΘのC | X 1 - α。従って、定義により、場合Θ 0は、その結果であるP θ Θ 0 | X 1 - αΘのCがいる場合にのみ信頼できる領域であり得るP Θ 0ΘのC | X > 0ΘcP(Θc|x)1αΘ0P(θΘ0|x)1αΘcP(Θ0Θc|x)>0

場合だけ私たちは、帰無仮説を受け入れる -credible領域が非ヌルのサブセットが含まれΘ 0を1αΘ0

より単純な特殊なケース

上記の例でどんな種類のテストがあるかをよりよく説明するために、次の特別なケースを考えてください。

xN(θ,1)θN(0,1)Θ=RΘ0=(,0]Θ1=(0,)θ0

P(θ0|x)=Φ(x/2),
Φ()

z1αΦ(z1α)=1αΘ0x/2>z1α

x2zα.α=0.05Θ0x>2.33

θN(ν,1)Θ0x>2.33ν

コメント

上記の損失関数は、帰無仮説を誤って受け入れることを誤って拒否するよりも悪いと考える場合、一見わずかに人工的なもののように見えるかもしれません。ただし、たとえば、危険な伝染病やテロリストのスクリーニングを行う場合など、「偽陰性」のコストが高くなる可能性がある状況では、非常に有用です。

Θ01α1α


2
+1 信頼区間の代わりに信頼領域を使用します

1
ありがとう@Procrastinator!答えを編集して、「地域」に変更しました。私は主に単峰性後天性のHPD領域で作業するため、信頼領域を区間と考える傾向があります。:)
MånsT12年

12

MichaelFraijoは、関心のあるパラメーター値が信頼できる領域に含まれているかどうかを単純に確認することは、信頼区間を反転することに相当するベイジアンであると示唆しました。この手順が本当に(通常の意味での)ベイジアンテストになったことは私には明らかではなかったので、最初はこれについて少し懐疑的でした。

判明したように、少なくとも特定の種類の損失関数を受け入れたい場合はそうです。HPD領域と仮説検定の間の関係を確立する2つの論文への参照を提供してくれたZenに感謝します。

H0:θΘ0={θ0}andH1:θΘ1=ΘΘ0,
Θ

Θ0Θ1

π()θ

T(x)={θ:π(θ|x)>π(θ0|x)}.

T(x)P(θT(x)|x)

Θ0P(θT(x)|x)<0.05θ0Θ05 %95 %

φ1Θ00Θ0

L(θ,φ,x)={a(1I(θT(x)),if φ(x)=0b+cI(θ(T(x)),if φ(x)=1,
a,b,c>0

Θ0P(θT(x)|x)<(b+c)/(a+c).

θ0

x

このトピックの詳細については、Madrugaらを引用した論文のリストを参照してください記事


2012年10月の更新:

x

qα(θ|x)θP(θqα(θ|x))=α(qα/2(θ|x),q1α/2(θ|x))Θ0x

Θ0={θ0}Θ0Θ1={θ:θ<θ0}Θ1={θ:θ>θ0}

φ=iΘi01

L2(θ,φ)={0,if θΘi and φ=i,i{1,0,1},α/2,if θΘ0 and φ=0,1,if θΘiΘ0 and φ=i,i{1,1},
Θ0θ0

これは非常に合理的な損失関数のように思えます。この損失、Madruga-Esteves-Wechslerの損失、および信頼できるセットを使用したテストについては、arXivの原稿でさらに説明します。


2
(私はコミュニティのwikiとしてこれをマーキングしています)
MånsT

L:{ParameterSpace}×{Actions}R

@Zen:はい、もちろん、私はそれを間違って言いました。それを指摘してくれてありがとう。:)
MånsT

3
@MånsT:(+1)これは興味深い答えです。この場合、これをCWとしてマークすることを選択したという事実を非常に尊重しますが、そうしないことを望みます。:
枢機

8

この質問に来る前に偶然あなたのarXivの論文を読んですでにブログエントリを書いています(0810月に掲載予定)。要約すると、私はあなたの理論的な興味の構築を見つけましたが、それは特に推奨されるにはあまりにも不自然だと思います。これは、従来、ポイントヌルパラメーター値に事前の質量を置く必要があるポイントヌル仮説ベイズ検定問題を解決していないようです。

φH0:θθ0H0:θ=θ0

H0Θ0={θ0}


1
1α/2α/2φ=0α/2<min(P(Θ1),P(Θ1))θ0信頼できる間隔にあります。arXiv原稿でこれをできるだけ早く変更します!
MånsT

H0

Θ0

1
H0P(θΘi|x)>α/2

3

ベイズの仮説検定には、信頼できる間隔(またはHPD領域)を使用できます。私はそれが一般的だとは思わない。ただし、公平を期すために、実際にはあまりベイズ仮説検定を使用せず、正式なベイジアン仮説検定も使用していません。仮説検定の設定では、ベイズ因子がときどき使用されます(ロバートの「ベイジアンコア」では多少賞賛されます)。


1
乾杯@Fraijo!あなたの答えがマイケル・チェルニックの答えとどう違うのか、少し詳しく説明していただけますか?
MånsT

2
仮説をテストするためのベイズ因子の使用は「偶発的」ではないと思います。たとえば、このリファレンスを参照してください

@MånsTは、マイケルが説明するプロセスのフォローアップで、ベイズ因子テストのようです。基本的に、仮説に基づいて異なる事前確率を持つ2つのモデルを作成し、それらの事前確率に基づいてデータセットの確率を比較します。投稿されたProcrasinatorのリファレンスは、これを簡単に確認します。
-Fraijo

1
@Procrastinator私の業界では、仮説をテストするためにベイジアン手法を使用するのはもちろん、ベイジアン手法を使用している人はほとんどいないため、たまにしか言いませんでした。個人的には、ベイズ因子を使用して、事前モデルに対する感度についてモデルをチェックします。これは、仮説検定の一形式であると思われます。
-Fraijo

1
@MånsT短い答え:いいえ。信頼できる区間を設定し、帰無仮説が含まれているかどうかを調べることが、頻繁な仮説検定に匹敵する唯一の直接検定です。この方法には2つの問題があります。1)場合によっては複数の領域を見つけることができるという事実(例:HPD対対称領域)および2)点仮説(シータ= a)のテストはベイズのパラメーターの理想と矛盾します分布を取る(シータ〜P(シータ))。
Fraijo

1

信頼できる領域は、領域全体の事後密度の積分が指定された確率(0.95など)である領域です。ベイズ仮説検定を作成する1つの方法は、パラメーターの帰無仮説値が信頼できる領域に該当するかどうかを確認することです。このようにして、信頼区間と仮説検定で頻繁に行われるのと同じように、仮説検定と信頼できる領域の間で同様の1-1対応をとることができます。しかし、これが仮説検定を行う唯一の方法ではありません。


この種のアドホックベイジアンテストは実際によく使用されますか?
MånsT

1
@MansTそうは思いません。通常、ベイジアンは、帰無仮説が真であり、データ構成事後オッズに基づいて事前オッズを設定すると思います。事後確率が帰無仮説に対して強烈に反対している場合、拒否されます。しかし、ベイジアン推論を頻繁に行うことはないので、私は尋ねるのに最適な人ではありません。
マイケルチャーニック

2
マイケルによって説明されたテストは、ベイナー計量経済学に関する彼の本の中で、ツェルナーによってリンドリーにクレジットされています。

1
はい、これらの種類のテストは確かにベイジアンのアイデアから生まれましたが、ベイジアンの決定理論に確固たる基盤があるかどうかはわかりません。後者の設定では、テストは通常​​はテスト関数を含む損失関数から導出されると予想されます。
MånsT

2

-1

ティムの答えを読んで方法を教えてください。

これは、列に仮説(推定パラメーター)があり、行に観測値があるテーブルビューに基づいています

ここに画像の説明を入力してください

最初の表では、col確率の合計は1になります。つまり、列イベントに入る条件が「prior」と呼ばれる一番下の行で提供される条件付き確率です。最後の表では、行の合計が1になり、中央に結合確率があります。つまり、最初の表と最後の表で条件付き確率に条件の確率、事前確率を掛けたものです。

テーブルは基本的にベイジアン変換を実行します。最初のテーブルでは、すべての列の観測値(行)のpdfを与え、この仮説の事前確率を設定します(はい、仮説列はその仮説に基づく観測値のpdfです)、それを行いますすべての列と表について、最初に共同確率表に入れ、次に観測の条件付けられた仮説の確率に入れます。

ティムの答えから得たように(間違っている場合は修正してください)、クリティカルインターバルアプローチは最初のテーブルを調べます。つまり、実験が完了すると、テーブルの行がわかります(この例では頭または尾ですが、100回のコインフリップや2 ^ 100行のテーブルを取得するなど、より複雑な実験を行うこともできます)。周波数主義者は列をスキャンします。これは、先ほど述べたように、仮説が冷たくなる条件での可能な結果の分布であり(例ではコインは公平です)、非常に低い確率値を与える仮説(列)を拒否します観測された行。

ベイジアン主義者はまず確率を調整し、列を行に変換し、表3を見て、観察された結果の行を見つけます。また、pdfであるため、彼は実験結果の行を調べて、95%の信頼性ポケットがいっぱいになるまで、最も確率の高い仮説を選択します。残りの仮説は棄却されます。

いかがですか?私はまだ学習過程にあり、グラフィックは私に役立つようです。評判の良いユーザーが2つのアプローチの違いを分析するとき、同じ絵を描くので私は正しい軌道に乗っていると信じています。私は仮説選択のメカニズムのグラフィカルなビューを提案しました。

私は誰もがキースの最後の答えを読むことをお勧めしますが、仮説テスト力学の私の写真は、頻度の高い人が現在の仮説を検証するときに他の仮説を見ていないとすぐに言うことができます観察されたデータの下で95%の確率で発生する単一の仮説がある場合、データがどれだけうまく適合するかに関係なく、他のすべての仮説をすぐに投げるからです。信頼区間の重なりに基づいて2つの仮説を対比する統計的検出力分析は別としてみましょう。

しかし、私は2つのアプローチの類似点を発見したようです:それらはP(A | B) > P(A) <=> P(B|A) > P(B)プロパティを介して接続されているようです。基本的に、AとBの間に依存関係がある場合、freqテーブルとベイジアンテーブルの両方で相関関係として表示されます。したがって、1つの仮説検定を実行すると、他の仮説検定と相関があり、同じ結果が得られます。相関関係の根を調べると、おそらく2つの関係がわかります。私の質問では、実際には絶対相関の代わりに違いがなぜあるのでしょうか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.