他の分析よりも早く行われた特権分析のベイジアン正当化とは何ですか?


26

背景と実証例

2つの研究があります。実験を実行し(研究1)、それを複製しました(研究2)。研究1では、2つの変数間の相互作用が見つかりました。研究2では、この相互作用は同じ方向であったが、有意ではなかった。研究1のモデルの概要は次のとおりです。

Coefficients:
                        Estimate Std. Error t value Pr(>|t|)    
(Intercept)              5.75882    0.26368  21.840  < 2e-16 ***
condSuppression         -1.69598    0.34549  -4.909 1.94e-06 ***
prej                    -0.01981    0.08474  -0.234  0.81542    
condSuppression:prej     0.36342    0.11513   3.157  0.00185 ** 

そして、研究2のモデル:

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
(Intercept)           5.24493    0.24459  21.444   <2e-16 ***
prej                  0.13817    0.07984   1.731   0.0851 .  
condSuppression      -0.59510    0.34168  -1.742   0.0831 .  
prej:condSuppression  0.13588    0.11889   1.143   0.2545  

「複製できなかったので、何も持っていないのではないか」と言う代わりに、私は2つのデータセットを結合し、データの調査対象のダミー変数を作成してから、インタラクションを実行しました研究ダミー変数を制御した後、再び。この相互作用は、それを制御した後でも重要であり、条件と嫌悪/ prejの間のこの双方向の相互作用は、研究ダミー変数との3方向の相互作用では修飾されないことがわかりました。

ベイジアン分析の紹介

これはベイジアン分析を使用する絶好の機会であると誰かに提案してもらいました。研究2では、事前情報として使用できる研究1の情報があります!このように、研究2は、研究1の通常の最小二乗法の結果である頻度主義者からのベイジアン更新を行っています。そこで、係数2の有益な事前分布を使用して、研究2モデルに戻って再分析します平均が研究1の推定値であり、標準偏差が研究1の標準誤差である場合の通常の事前分布。

これは結果の要約です:

Estimates:
                       mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)             5.63    0.17    5.30    5.52    5.63    5.74    5.96
condSuppression        -1.20    0.20   -1.60   -1.34   -1.21   -1.07   -0.80
prej                    0.02    0.05   -0.08   -0.01    0.02    0.05    0.11
condSuppression:prej    0.34    0.06    0.21    0.30    0.34    0.38    0.46
sigma                   1.14    0.06    1.03    1.10    1.13    1.17    1.26
mean_PPD                5.49    0.11    5.27    5.41    5.49    5.56    5.72
log-posterior        -316.40    1.63 -320.25 -317.25 -316.03 -315.23 -314.29

調査2の分析から得られた相互作用については、かなり堅実な証拠が得られたようです。これは、単にデータを積み重ねて、スタディ番号をダミー変数としてモデルを実行したときに行ったことと一致しています。

反事実:最初にスタディ2を実行した場合はどうなりますか?

それは私に考えさせられました:最初に研究2を実行し、研究1のデータを使用して研究2に対する私の信念を更新したらどうでしょうか?上記と同じことを行いましたが、逆に、研究1のデータを分析するための事前手段および標準偏差として、頻度2、通常の最小二乗係数推定値、研究2からの標準偏差を使用して研究1のデータを再分析しました。要約結果は次のとおりです。

Estimates:
                          mean    sd      2.5%    25%     50%     75%     97.5%
(Intercept)                5.35    0.17    5.01    5.23    5.35    5.46    5.69
condSuppression           -1.09    0.20   -1.47   -1.22   -1.09   -0.96   -0.69
prej                       0.11    0.05    0.01    0.08    0.11    0.14    0.21
condSuppression:prej       0.17    0.06    0.05    0.13    0.17    0.21    0.28
sigma                      1.10    0.06    0.99    1.06    1.09    1.13    1.21
mean_PPD                   5.33    0.11    5.11    5.25    5.33    5.40    5.54
log-posterior           -303.89    1.61 -307.96 -304.67 -303.53 -302.74 -301.83

繰り返しますが、相互作用の証拠が見られますが、必ずしもそうであるとは限りませんでした。両方のベイジアン分析のポイント推定値は、互いに95%の信頼できる間隔にさえないことに注意してください。ベイジアン分析からの2つの信頼できる間隔は、オーバーラップするよりもオーバーラップしないことが多くなります。

時間優先のベイジアン正当化とは

したがって、私の質問は次のとおりです。データがどのように収集および分析されたかの年代順を尊重するためにベイジアンが持っている正当化は何ですか?スタディ1から結果を取得し、スタディ2で有益な事前情報として使用するため、スタディ2を使用して信念を「更新」します。しかし、取得した結果が真のポピュレーション効果を持つ分布からランダムに取得されたと仮定した場合、なぜ研究1の結果に特権を与えるのですか?スタディ1の結果をスタディ2の優先順位として使用する代わりに、スタディ2の結果をスタディ2の優先順位として使用する理由は何ですか?分析を収集して計算した順序は本当に重要ですか?私にはそう思わないようです。これに対するベイジアンの正当化は何ですか?最初にスタディ1を実行したからといって、ポイント推定値が.17よりも.34に近いと考える必要があるのはなぜですか?


Kodiologistの回答への対応

コディオロジストは次のように述べました。

これらのポイントの2番目は、あなたがベイジアン大会から出た重要な出発点です。最初に事前に設定してから、両方のモデルをベイジアン式に適合させたわけではありません。1つのモデルを非ベイジアン方式で適合させ、それを他のモデルの事前確率に使用します。従来のアプローチを使用した場合、ここで見た順序への依存は見られません。

これに対処するために、すべての回帰係数の事前確率がである研究1および研究2のモデルを適合させました。変数は、0又は1を符号化された、実験条件のためのダミー変数でした。変数と同様に、結果は、両方の1から7までの7点尺度で測定したしたがって、私はそれが前の公正な選択だと思います。データがどのようにスケーリングされるかだけで、以前に示唆されたものよりもはるかに大きな係数を見るのは非常にまれです。N(0,5)condprej

これらの推定値の平均推定値と標準偏差は、OLS回帰の場合とほぼ同じです。調査1:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.756    0.270    5.236    5.573    5.751    5.940    6.289
condSuppression        -1.694    0.357   -2.403   -1.925   -1.688   -1.452   -0.986
prej                   -0.019    0.087   -0.191   -0.079   -0.017    0.040    0.150
condSuppression:prej    0.363    0.119    0.132    0.282    0.360    0.442    0.601
sigma                   1.091    0.057    0.987    1.054    1.088    1.126    1.213
mean_PPD                5.332    0.108    5.121    5.259    5.332    5.406    5.542
log-posterior        -304.764    1.589 -308.532 -305.551 -304.463 -303.595 -302.625

そして研究2:

Estimates:
                       mean     sd       2.5%     25%      50%      75%      97.5% 
(Intercept)             5.249    0.243    4.783    5.082    5.246    5.417    5.715
condSuppression        -0.599    0.342   -1.272   -0.823   -0.599   -0.374    0.098
prej                    0.137    0.079   -0.021    0.084    0.138    0.192    0.287
condSuppression:prej    0.135    0.120   -0.099    0.055    0.136    0.214    0.366
sigma                   1.132    0.056    1.034    1.092    1.128    1.169    1.253
mean_PPD                5.470    0.114    5.248    5.392    5.471    5.548    5.687
log-posterior        -316.699    1.583 -320.626 -317.454 -316.342 -315.561 -314.651

これらの平均と標準偏差は、OLS推定値とほぼ同じであるため、上記の順序効果は依然として発生します。スタディ2を分析するときに、スタディ1の事後要約統計を事前にプラグインすると、スタディ2を最初に分析し、スタディ1を分析するための事前分布としてそれらの事後要約統計を使用する場合とは異なる最終事後を観察します

頻度係数の推定ではなく、ベイジアン平均と回帰係数の標準偏差を事前分布として使用しても、同じ次数効果が観察されます。それで、疑問が残ります:最初に来た研究を特権化するためのベイジアン正当化は何ですか?


2
「私はまだ同じ状況にいるでしょう。だから問題は残ります。最初に来た研究を特権化するためのベイジアンの正当化は何ですか?」—え?どのような意味で、あなたはまだ研究1を特権化していますか?ここで説明したように、または逆の順序で2つのモデルを適合させることができprej、手順を誤解しない限り、例えば、真の母係数の最終推定値はどちらの方法でも同じです。
-Kodiologist

@Kodiologistわかりやすくするために、手順の詳細を含めて編集しました。
マークホワイト

1
共分散行列とエラーはどうですか?関節全体を新しい優先度として使用する必要があります。
Scortchi -復活モニカ

@Scortchi bingo—それが正しい答えだと思う、そしてそれはunutbuの答えが私を信じさせたものだったと思う。私がしたことは、更新の非常に粗雑なバージョンでした。私は、全体の共同事後ではなく、要約統計を取りました。それは質問を意味します:全体の関節後部を事前rstanarmまたはスタンとして含める方法はありますか?:その質問は前にここに依頼されているように思えるstats.stackexchange.com/questions/241690/...
マーク・ホワイト

1
係数のガウス事前分布(&独立性?)と分散の逆ガンマから始めている場合、通常の逆ガンマ事前分布と共役です。更新式を調べます。
Scortchi -復活モニカ

回答:


22

ベイズの定理によると、再スケーリング後posteriorはに等しくなりますprior * likelihood(確率の合計は1になります)。各オブザベーションには、likelihoodを更新しpriorて新しいを作成するために使用できるがありますposterior

posterior_1 = prior * likelihood_1
posterior_2 = posterior_1 * likelihood_2
...
posterior_n = posterior_{n-1} * likelihood_n

そのため

posterior_n = prior * likelihood_1 * ... * likelihood_n

乗算の可換性は、更新を任意の順序で実行できることを意味します。したがって、1つの事前分布から開始する場合、スタディ1とスタディ2の観測値を任意の順序で混合し、ベイズの公式を適用して同じファイナルに到達できますposterior


1
完全に理にかなっています。したがって、これは矛盾の考えられる理由を示しています:分析を行った方法(事後要約統計を次の研究の前の引数にプラグインする)は、更新がどのように機能するのではありませんか?つまり、要約統計を後続の分析の事前にプラグインするだけでなく、事後全体を検討する必要があります。正しい?
マークホワイト

4
@MarkWhite正しい。最初の分析の事後分布は、2番目の分析の事前分布である必要があります。
-Kodiologist

4
@Kodiologistと後方についての要約統計!=後方
Mark White

@MarkWhiteそう。
-Kodiologist

22

最初に指摘する必要があります:

  1. 有意性テストのアプローチでは、否定的な結果を別のモデルで追跡し、肯定的な結果を得る別の機会を与えました。このような戦略により、プロジェクトごとのタイプIエラー率が増加します。有意性テストでは、値が正しいために事前に分析戦略を選択する必要があります。p
  2. 調査結果をそのサンプルから直接事前に変換することにより、研究1の結果に多くの信頼を置いています。事前分布は、過去の発見を単に反映したものではありません。以前の調査結果の前にあなたの信念を含む、あなたの既存の信念の全体をエンコードする必要があります。スタディ1にサンプリング誤差と、モデルの不確実性など、扱いにくい他の種類の不確実性が関係していることを認める場合は、より保守的な事前分布を使用する必要があります。

これらのポイントの2番目は、あなたがベイジアン大会から出た重要な出発点です。最初に事前に設定してから、両方のモデルをベイジアン式に適合させたわけではありません。1つのモデルを非ベイジアン方式で適合させ、それを他のモデルの事前確率に使用します。従来のアプローチを使用した場合、ここで見た順序への依存は見られません。


1.別のモデルで否定的な結果をどのようにフォローアップしましたか?「否定的な結果」とはどういう意味ですか?調査全体のタイプIエラー率に関しては、これらは互いに数週間離れて実施された2つの別個の調査です。いずれにせよ、探索的データ分析を行うことを信じているため、実際のp値が「正しい」とは思わないか、「完全に正しい」と期待する必要はありません。事前に考えていたテストだけを行うと、偶然に起こった多くのすばらしい発見を逃すことになり、大量のデータを無駄にすることになります。
マークホワイト

2
p

1
2.はい。ただし、スタディ2の事前確率は異なりますが、スタディ1が正確であるという考えにそれほど多くの信頼を置くことにはなりませんでした。
Kodiologist

1
1.問題は、より多くのデータを収集して分析することではなく、2番目のデータセットを最初に分析したときに否定的な結果が得られたため、両方の研究からデータを再分析したことです(新しい予測子を持つ統合モデルを使用)。有意性検定が実際に有用であると信じる理由を見たことはありませんが、有意性検定に関するすべての定理はその有用性をサポートするものであり、すべての定理のような定理が必要と考えると思われる人の多くは結論を得るための特定の前提。
-Kodiologist

1
@Kodiologist-有意性テストがこれまでになく有用だと思わない場合、2つのサンプルの全員がそうであったためにほとんどの人が青い目を持っている可能性が高いと結論付ける研究者をどのような根拠で疑っていますか?
オビー2.0

4

様式化された別の問題を含む一連のグラフを作成して、頻度論からベイジアン法に移行することが危険な理由と、要約統計量を使用すると問題が発生する理由を示すことができると考えました。

多次元の例を使用するのではなく、サイズが3つの観測と3つの観測である2つのスタディで1つの次元に切り詰めます。

1π11+(xθ)2.

中心極限定理が適用されず、十分な統計がなく、極端な観測が一般的であり、チェビシェフの不等式が成り立たず、通常実行可能なソリューション全体がバラバラになるため、私はそれを使用しています。私はそれを使用しているのは、それが問題に多くの労力を費やすことなく素晴らしい例になるからです。

{5,1,4}{1.5,1,.5}±669σ±3σ

2つの別々の研究の事後密度は ベイジアン分離後天的

視覚的に明らかなように、サンプル1から要約統計を取得することは、非常に誤解を招く可能性があります。優れた、単峰性の、明確に定義された名前付きの密度に慣れている場合は、ベイジアンツールを使用してすぐに外に出ることができます。このような名前付き分布はありませんが、視覚的に見ていない場合は、要約統計で確実に説明できます。サマリー統計を使用すると、それを使用して新しい事前統計を作成する場合に問題になる可能性があります。

両方のサンプルの頻度論的信頼度分布は同じです。スケールは既知であるため、不明なパラメーターは中央値のみです。サンプルサイズが3の場合、中央値はMVUEです。コーシー分布には平均や分散はありませんが、中央値のサンプリング分布にはあります。最尤推定量よりも効率的ではありませんが、計算に労力はかかりません。サンプルサイズが大きい場合、ローテンバーグの方法はMVUEであり、サンプルサイズが中程度のソリューションもあります。

Frequentistディストリビューションでは、次のようになります 頻繁な信頼分布。

Pr(x|θ)Pr(θ|x)

頻度分布は、サンプルサイズ3の描画の無限の繰り返しを想定しており、サンプル中央値の分布の制限分布を示しています。ベイズ分布にはが与えられるため、観測されたサンプルのみに依存し、このサンプルが持つ可能性のある良好または不良な特性を無視します。実際、このサンプルはベイジアン法では珍しいため、一時停止を与えて、それについての強い推論を形成することができます。これが、後部がとても広く、サンプルが異常な理由です。Frequentistメソッドは異常なサンプルを制御していますが、Bayesianメソッドは制御していません。これは、スケールパラメーターの追加された確実性が周波数主義の解を狭めるが、ベイジアンを拡張するという逆のケースを作成します。x

関節後部は、両方の事後因子の積であり、乗算の結合性により、使用する順序は関係ありません。視覚的には、関節の後方は共同および個別の事後です。

事後分布に単純化された分布を課し、それらの要約統計量を使用した場合、おそらく異なる答えが得られることは明らかです。実際、それは非常に異なる答えだったかもしれません。70%の信頼できる領域が研究1に使用された場合、信頼できない領域が切断されていたはずです。切断された間隔の存在は、ベイジアン法で時々発生します。調査1の最高密度間隔と最低密度間隔の図は、HDRとLDR

HDRは、信頼できるセットの外にある領域のスライバーによって壊れていることに気づくでしょう。

これらの問題の多くは、回帰を使用した大きなセットでは一般的に解消されますが、ベイジアン法と頻度論法では、回帰で欠損変数を異なる方法で処理する方法の自然な違いの例を示します。

不足している1つの変数(天気)を含む、適切に構築された回帰を考えます。雨の日と晴れの日で顧客の行動が異なると仮定しましょう。その差が十分であれば、2つのベイジアン事後モードが簡単に存在する可能性があります。1つのモードは日当たりの良い動作を反映し、もう1つのモードは雨を反映します。2つのモードがある理由がわかりません。統計的な実行または欠落したデータポイントの可能性がありますが、サンプルが異常であるか、モデルの変数が省略されています。

Frequentistのソリューションは、2つの状態を平均し、顧客の行動は実際には発生しないが、2つのタイプの行動を平均化する領域に回帰直線を置くことがあります。また、下方にバイアスがかかります。特に真の分散に大きな違いがある場合、問題は残差の分析に巻き込まれる可能性がありますが、そうでない場合があります。それは時々クロスバリデーションに現れる残差の奇妙な写真の一つかもしれません。

同じデータから2つの異なる後継者がいるという事実は、2つを直接乗算しなかったことを意味します。ベイジアン事後と1対1で対応しなかったフリークエンティストソリューションから事後を作成したか、サマリー統計から事前確率を作成し、尤度関数は完全に対称ではありませんでした。これは一般的です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.