尤度原理が頻繁な確率と衝突する場合、そのうちの1つを破棄しますか?


19

ここに最近投稿されたコメントで、1人のコメンターが、頻度の高い推論が尤度の原則と衝突することを(ソースなしで)指摘するLarry Wassermanのブログを指摘しました。

尤度の原理は、同様の尤度関数を生成する実験は同様の推論を生成する必要があると単純に述べています。

この質問に対する2つの部分:

  1. 頻度論的推論のどの部分、フレーバーまたはスクールは、尤度原理に特に違反していますか?

  2. 衝突がある場合、どちらかを破棄する必要がありますか?もしそうなら、それからどれ?議論のために、ハッキングロワイヤルが尤度原理は公理的であると私に確信させたので、何かを破棄しなければならない場合、衝突する頻度の高い推論の部分を破棄する必要があることをお勧めします。


2
尤度原理が公理であるべき理由を私は理解したことがありません。
ステファンローラン

6
こんにちは、ステファン。問題は、Birnbaumが、尤度が他の2つの原則と同等であることを証明したことです。この結果について短いレビューを書きました。ここで:ime.usp.br/~pmarques/papers/redux.pdf

@Zenありがとう。一見したところ、私が同意しない点は、条件文の原則の下に書かれたこの文です:「重要なのは実際に起こったことです」。代わりに「重要なのは、発生する可能性のある問題の中で実際に何が起こったのか」です(私の英語が正しくない場合は申し訳ありません)。それがgui11aumeとの議論で私が主張したことです。ある意味で、尤度の原理は実験のデザインは問題ではないと主張し、この点には同意できません。
ステファンローラン

1
@Zen今、あなたの論文をもっと注意深く読みました。条件性の原則と不変性の原則に反対するのは難しいことは事実です。
ステファンローラン

1
LPは、実用的な理由から、最近ではそれほど人気が​​ありません。宗教的に採用することにより、ジェフリーズの事前確率、共役事前確率、多くの状況で役立つ可能性がある仮説検定などのモデル依存事前確率の使用を回避できます。物理学と同じ統計は、意味のある方法で公理化することはできないと思います(この議論はこのように聞こえるかもしれませんが)。しかし、異なるパラダイムの利点と欠点を識別することが重要です。

回答:


12

尤度原理と衝突する頻度論的アプローチの一部は、統計的検定(およびp値計算)の理論です。通常、次の例で強調表示されます。

2 Frequentistが偏っコインを、勉強したいとしている未知のpropabilityを持つターンの頭」。彼らはそれが「テール」に偏っているのではないかと疑っているため、同じ帰無仮説と同じ対立仮説仮定しています。、P = 1 / 2 、P < 1 / 2pp=1/2p<1/2

最初の統計学者は、「ヘッド」が現れるまでコインを裏返します。これはたまたま6回です。2番目は、コインを6回裏返すことを決定し、最後のスローで1つの「ヘッド」のみを取得します。

最初の統計学者のモデルによると、p値は次のように計算されます。

p1p5+p1p6+=p1p511p=p1p4

2番目の統計学者のモデルによると、p値は次のように計算されます。

61p1p5+601p6=5p+11p5

をに置き換えると、最初はに等しいp値を見つけ、2番目は等しいp値を見つけます。1 / 2 1 / 2 5 = 0.03125 7 / 2 × 1 / 2 5 = 0.109375p1/21/25=0.031257/2×1/25=0.109375

それで、彼らは異なることをしたので、異なる結果を得るでしょう?しかし、尤度原理によれば、彼らは同じ結論に達するはずです。簡単に言えば、尤度の原理では、推論に重要なのは尤度だけであると述べています。したがって、ここでの衝突は、両方の観測値がに比例して同じ尤度を持っているという事実から生じます(尤度は比例定数まで決定されます)。p(1p)5

私の知る限り、あなたの2番目の質問に対する答えは議論された意見です。私は個人的に、上記の理由、およびこのブログ投稿で説明されている他の理由のために、テストの実行とp値の計算を避けようとしています。

編集:今私はそれについて考えると、信頼区間による推定も異なります。実際、モデルが異なる場合、CIは構造によって異なります。p


1
実際の結果に基づく尤度だけでなく、起こりうる各結果の確率を考慮するため、頻度論統計(仮説検定、信頼区間)で尤度原理が明らかに違反しているという印象を受けます。右 ?
ステファンローラン

@StéphaneLaurentはい、それは私がそれを理解する方法でもあります。ジェームズ・バーガーは統計的決定理論とベイジアン分析で良い引用を持っています。それは、観測されなかったデータのために頻繁に仮説を否定することがあると言っています
gui11aume

ありがとう、gui11aume。P値の「意味」が実験者の意図によって変化する例としてそれを解釈する権利はありますか?P値が帰無仮説の下で均一に分布しなければならないので、P値が一種の閾値の偽陽性エラー率として解釈される場合だと思いますか?それは、P値が証拠の強さの指標として提示されるフィッシャーのアプローチで必要ですか?
マイケルルー

4
(+1)通常、この種の不一致は、モデルの1つに停止規則が含まれている場合に発生します。

1
@Scortchi実際、私はP値の1つが正しい尤度関数を指し、もう1つがそうではないと考えるのは間違っていました。どちらも頭の確率に関連する証拠を提示する同じ尤度関数を指します。前のコメントの最後の2文は無視してください。(編集できません、編集できますか?)
マイケルルー

4

私は@ gui11aume(+1)の例が好きですが、2つの値の違いは、2人の実験者が使用する異なる停止規則によってのみ生じるという印象を与えることができます。p

実際、これはもっと一般的な現象だと思います。@ gui11aumeの答えの2番目の実験者を考えてみましょう。コインを6回投げ、最後の投げでのみ頭を観察する人です。結果は次のようになります。何 -値は?通常のアプローチは、公正なコインが1つ以下のヘッドになる確率を計算することです。合計うち1個以下のヘッドを持つ可能性がつあるため、です。P 7 64 、P = 7 / 64 0.109

TTTTTH,
p764p=7/640.109

しかし、別の検定統計量を取得してみませんか?たとえば、この実験では、5つの尾が連続して観察されました。最長のテールのシーケンスの長さを検定統計量としてみましょう。5つまたは6つのテールが連続する可能性があるため、です。P = 3 / 64 0.0473p=3/640.047

したがって、この場合、エラー率が固定されていれば、検定統計量を選択すると、結果が簡単に有意であるかどうかがわかります。これは、停止ルール自体とは関係ありません。α=0.05


投機的部分

哲学的に、検定統計量の頻繁な選択は、あいまいな意味で、事前のベイズ選択と似ていると言えます。不公平なコインがこのまたはその特定の方法で動作すると考えているため、1つまたは別のテスト統計を選択します(この動作を検出する力が必要です)。コインの種類を優先することに似ていませんか?

その場合、値は「証拠の量」だけでないため、すべての証拠が尤度にあると言う尤度の原則は値と衝突しません。それは「驚きの尺度」ですが、何かが驚きの尺度となるのは、それが驚くべきことを説明している場合のみです。 -value試みは、一つのスカラ量の証拠と(検定統計量の選択に示されるように)前の予想のある種の両方を結合します。もしそうなら、それは尤度自体と比較されるべきではなく、おそらくむしろ後方と比較されるべきですか?p pppp

この投機的な部分について、ここまたはチャットで意見を聞きたいと思います。


@MichaelLewとの議論を更新

上記の例では、この議論のポイントを逃したのではないかと心配しています。異なる検定統計量を選択すると、尤度関数も変化します。したがって、上記で計算された2つの異なる値は2つの異なる尤度関数に対応するため、尤度原理と値の間の「衝突」の例にはなりません。@ gui11aumeの例の利点は、値が異なっていても尤度関数がまったく同じままであることです。p pppp

上記の「投機的」部分にとってこれが何を意味するのか、まだ考えなければなりません。


興味深い考え。はい。P値が尤度関数と同じ方法で証拠として解釈されない限り、LP値とP値の間に矛盾がない必要があることに同意します。尤度関数には、統計モデルが与えられた対象パラメータに関連する証拠が含まれています。検定統計量を変更すると、モデルが変更されるため、代替モデルの尤度関数は、元の尤度関数とは(おそらく)異なります。
マイケルルー

マイケル、「統計モデル」の正確な意味はわかりませんが、頭確率コインはすでにモデルではありませんか?テスト統計を変更すると、モデルはどのように変わりますか?p
アメーバは、Reinstate Monicaを

それとは別に、私はあなたの「To P or not P」の論文を読み直していたので、この質問を見つけました(そして、Googleの「尤度の原則」)。私は一般的にこの論文が好きですが、4.4節で完全に混乱しました。停止ルールを考慮してp値を「調整」しないでください。ただし、式5〜6には調整がありません。「未調整」のp値はどうなりますか?そのうちの1つが調整され、もう1つが調整されないということですか?もしそうなら、どれ、そしてその逆はなぜですか?
アメーバは、Reinstate Monica

統計モデルはしばしば無視されるか、暗黙のうちに不変であると仮定されます。ただし、コインの場合は、固定の未知の頭の確率、観測のランダムな選択、および試験外の頭の検定統計量、可能な結果の二項分布が含まれます。結果の分布が行の検定統計量の裾について何であるかはわかりませんが、異なると思われます。たとえ同じであっても、検定統計量を持つモデルは元のモデルと同じではないため、すべての証拠が含まれていても尤度関数は異なる可能性があります。
マイケルルー

私はその論文の完全な手直しをほぼ終えました。この議論に関連していますが、まだ提出の準備ができていません。(このチャットですか?)
マイケルルー
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.