サンプリング分布は推論に合法ですか?


15

一部のベイジアンは、研究者の意図に依存するため、「固有のサンプリング分布は存在しない」と述べる頻繁な推論を攻撃します(Kruschke、Aguinis、&Joo、2012、733)。

たとえば、研究者がデータ収集を開始したが、40人の参加者がいた後、予想外に資金が削減されたとします。サンプリング分布(および後続のCIとp値)は、ここでどのように定義されますか?各構成サンプルにN = 40があると仮定しますか?または、異なるNのサンプルで構成され、各サイズは、彼の資金が削減された可能性のある他のランダムな時間によって決定されますか?

教科書にあるt、F、カイ2乗(等)、null分布はすべて、Nがすべての構成サンプルに対して固定され、一定であると仮定していますが、実際にはそうではない場合があります。さまざまな停止手順(たとえば、特定の時間間隔の後、またはアシスタントが疲れるまで)ごとに、異なるサンプリング分布があるようです。これらの「試行された」固定N分布の使用は不適切です。

この批判は、頻度の高いCIとp値の正当性をどの程度損ないますか?理論上の反論はありますか?サンプリング分布の概念を攻撃することにより、頻繁な推論の全体の構造は希薄になっているようです。

学術的な参考文献は大歓迎です。


1
引用の対象:Kruschke、JK、Aguinis、H.、&Joo、H.(2012)。時が来た:組織科学におけるデータ分析のためのベイジアン手法。しかし、Kruschkeは(2010)Bayesian data analysisと(2010)what to believe:Bayesian methods for data analysisで以前使用していました。
ATJ 14年

回答:


21

通常、対象のパラメーターに付随するため、実際のサンプルサイズ条件に推論を実行します。つまり、真の値に関する情報は含まれておらず、測定できる精度にのみ影響します。コックス(1958)、「統計的推論に関連する問題」、アン。数学。統計学者。29、2は、通常、最初はそれが「関連するサブセット」のフィッシャーの考えに背をharking、かなり早い時期の作品で暗黙的だったが、時々 、コンディ原則として知られているものexplicatingとして引用されています。n

これまでの結果が期待外れだったために研究者の資金が遮断された場合、もちろんは補助的ではありません。おそらく、問題の最も簡単な例は、二項(試行回数を固定)または負の二項(固定番号を成功)サンプリングスキームからベルヌーイ確率の推定です。どちらの場合でも十分な統計は同じですが、その分布は異なります。どちらがフォローされたかわからない実験をどのように分析しますか?Berger&Wolpert(1988)、Likelihood Principleは、この&その他の推論の停止規則の意味を議論しています。n

サンプリング分布を考慮に入れない場合はどうなるかを考えてください。アーミテージ(1961)、「スミス『統計的推論と意思決定における一貫性』に関するコメント」、JRSS B、23、1は指摘している場合、サンプルまでの正規分布からの√をx、平均ことをテストするための尤度比μ=0μが0であり、Lは0 nx¯kμ=0μ0、研究者の適切な選択により予めこれに結合した設定できるようにK。頻度の高い分析のみが、このかなり不公平なサンプリングスキームに基づく尤度比の分布を考慮することができます。回答を参照してください、「ベイズ推論を誤解の周波数の境界」、Kerridge(1963)アン。数学。統計 34トウモロコシ畑(1966年)、 "シーケンシャル試験では、逐次解析、および尤度原則"、アメリカの統計学者20、2、&L(0)L(x¯)ek2/2k"当然の結論に推論" Kadane(1996)、JASA91、435

頻繁な推論が研究者の意図に依存していることを指摘することは、ベイジアン推論の「主観性」について高い馬に乗っている人々(まだあれば)を手軽に調べることです。個人的に、私はそれと一緒に暮らすことができます。長い一連の繰り返しでの手順のパフォーマンスは、常に概念的なものになります。これは、考慮すべき有用なものを損なうものではありません(「尤度の較正」は、Coxがp値を記述する方法でした)。参照の日付から、これらの問題はそれほど新しいものではないことに気付いたかもしれません。先験的な議論によってそれらを解決しようとする試みは、(インターネット上を除き、些細な事柄を除いて常に時代遅れである)主に死にました。

PS:Berger&Wolpertにカウンターバランスを追加することを考えているCox&Mayo(2010)、「頻度と頻度の推論における客観性と条件性」、Error and Inferenceで起こりました。議論が終わったという私の主張には、希望的観測の要素がある可能性が非常に高いが、半世紀かそこらでこの問題について語られることはほとんどないというのは驚くべきことだ。(それでも、これは頻繁なアイデアの簡潔で雄弁な防御です。)


1
+1(かなり前)。アーミテージの推論が、二項サンプリング対二項サンプリングのよく知られた例に適応できるかどうか疑問に思っています。例えば、コイン投げのTTTTTHシーケンスを観察すると、停止ルールに応じてp = 0.03またはp = 0.1 得られます。私たちは今、さらに別の停止のルール、例えば考えるのであれば、それは1ではなくすべきであるということではなく直感的になり、「二項のp <0.05までキープ投げをし、T H 1、少なくとも少なくとも1つがあった」ではない推論のために、この停止ルールを無視(尤度原則に違反しているにもかかわらず)。これは理にかなっていますか?
アメーバは、モニカーを復活させる

4

あなたの質問に対する短い答えは、あなたが尋ねる人次第です;-)ダイハードベイジアンは、頻繁な方法論に対する勝利、または少なくとも同等を宣言します。ダイハードの常連客はデフォルトで「これは答えられない」になります。統計学者の他の99%は、実験が中断されていない場合に信頼できることが示されている方法を使用します。

私は、研究者の意図に対するサンプリング分布の感度が問題になる可能性があることを知っています。そして、その問題に対する本当に良い解決策は本当にありません。ベイジアンとフリークエンシストは、推論を形成する方法を決定する際に、ある程度の主観性と判断力を使用する必要があります。ただし、一般的に物議をかもしている領域から例を挙げていると思いますが、問題を頻繁に推測する根拠に基づいているだけです。順次および/または停止した実験は、推論の主観的な性質の典型的な例であり、絶対的な客観的ではなく、同意された答えです。

実際に取得するサンプルを実際に収集する定期的な推論はどうですか?ここでは、ベイジアン推論が個人的および主観的な性質を保持しているのに対し、CIおよびp値は繰り返しサンプリング特性によって適切に調整されているため、頻度の高い方が優位だと思います。

ベイジアン応答のより理論的な説明が必要な場合は、主要な研究者がナンシーリードとレーマンである「条件付き推論」について読みます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.