デボラメイヨーは、ビルンバウムの尤度原理の証明に反論しましたか?


27

これは、ここでの以前の質問と多少関連しています。尤度の原則が*本当に*重要な例ですか?

どうやら、Deborah Mayoは Birnbaumの尤度原理の証明に反論する統計科学の論文を発表したようです。誰もがビルバウムの主な議論とメイヨーの反論を説明できますか?彼女は(論理的に)正しいですか?



3
より多くのコメント:stats.stackexchange.com/questions/65520/...
rolando2


4
マイケルルーの質問に対する賞金に感謝します。
statslearner2

4
再び賞金、三度目は魅力です。
statslearner2

回答:


4

一言で言えば、Birnbaumの議論は、広く受け入れられている2つの原則が、論理的に、尤度の原則を保持する必要があることを暗示しているということです。Mayoの反論は、Birnbaumが原則の1つを誤用しているため、証拠が間違っているということです。

以下では、あまり厳密ではない範囲で引数を簡略化します。私の目的は、元の議論が非常に技術的であるため、より多くの聴衆にそれらをアクセス可能にすることです。興味のある読者は、質問とコメントにリンクされている記事の詳細を参照してください。

具体性のために、未知のバイアスθを持つコインの場合に焦点を当てます。実験E1では、10回ひっくり返します。実験E2では、3つの「尾」が得られるまでそれを反転します。実験Emixでは、「1」と「2」というラベルの付いた公正なコインをフリップします。「1」になった場合、E1を実行します。「2」になった場合、E2を実行します。この例は、議論を大幅に簡素化し、議論の論理を示します(元の証明はもちろんより一般的です)。

原則:

次の2つの原則が広く受け入れられています。

Weak Conditionality Principleは、実験E1を実行することを決定した場合、またはEmixを実行することを決定し、コインが「1」に着地する場合、同じ結論を出す必要があると述べています。

十分性の原則は、十分な統計量が同じ値を持つ2つの実験で同じ結論を引き出すべきだと言っています。

次の原則は、ベイジアンによって受け入れられますが、頻繁に受け入れられるものではありません。しかし、Birnbaumは、それが最初の2つの論理的な結果であると主張しています。

Likelihood Principleは、尤度関数が比例する2つの実験で同じ結論を引き出すべきだと言っています。

ビルンバウムの定理:

E1を実行し、10回のフリップから7つの「ヘッド」を取得したとします。θの尤度関数はです。を実行し、コインを10回フリップして、3つの「テール」を取得します。の尤度関数はです。2つの尤度関数は比例しています。(103)θ7(1θ)3E2θ(97)θ7(1θ)3

バーンバウムは、上の次の統計考慮からする: ここでとはそれぞれ「頭」と「尾」の数です。したがって、何が起こっても、は結果を実験から来たかのように報告します。にはで十分であることがます。自明でない唯一のケースは、および場合です。Emix{1,2}×N2{1,2}×N2

T:(ξ,x,y)(1,x,y),
xyTE1TθEmixx=7y=3

P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1θ)30.5×(103)θ7(1θ)3+0.5×(97)θ7(1θ)3=(103)(103)+(97).
PXのMI、X=2XY|T=1XYXのMIXTθTθ を除き、他のすべてのケースは0または1 です。これは、上記の確率の補数です。が与えられたの分布はに依存しないため、は十分な統計量です。P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ

さて、十分性の原則に従って、とについて同じ結論を出さなければなりません。また、弱いコンディショナリティの原則から、におけると中、ならびにためのにおける及び中。したがって、結論はすべての場合で同じでなければなりません。これが尤度の原則です。(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix

メイヨーの反証:

Birnbaumのセットアップは、「1」と「2」というラベルの付いたコインの結果が観察されなかったため、混合実験ではありません。したがって、弱い条件性の原則はこの場合には適用さません。

テストとを取り、テストのp値から結論を導きます。予備的観察、p値ことに留意されたいとしてで約として二項分布によって与えられる。p値に約として負の二項分布によって与えられる。θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898

ここで重要な部分来る:のp値で 2の平均値として与えられているが-私たちはコインの状況を知らない覚えている- つまりは、約。まだのp値に -コインが観察される-と同じである、すなわち約。弱い条件性の原則は成り立っています(結論は、コインが「1」に着くとでも同じです)が、尤度の原則はそうではありません。反例は、ビルンバウムの定理を反証します。T=(1,7,3)Emix 0.1309 1 7 3 EのM iはxは E 1 0.1719 E 1 E M I Xを0.1309(1,7,3)EmixE10.1719E1Emix

ペーニャとバーガーのメイヨーの反論に対する反論:

メイヨーは暗黙のうちに十分性原則の声明を変更しました。彼女は「同じ結論」を「同じ方法」と解釈します。p値の取得は推論方法ですが、結論ではありません。

自給の原則は、と言っている場合、十分な統計が存在し、その後、結論は同じでなければなりませんが、それは十分な統計は全く使用する必要はありません。もしそうなら、メイヨーによって実証されたように、それは矛盾につながるでしょう。


1
サイドノートとして、誰がいつ、どのようにそれらが適用されるのかを本当に誰も分からない場合、設立原則の価値を疑問視するかもしれません。公理的方法が確率ではうまく機能するが、統計学の理論ではそれほどうまく機能しないのはなぜだろうか。
gui11aume
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.