背景と実証例
2つの研究があります。実験を実行し(研究1)、それを複製しました(研究2)。研究1では、2つの変数間の相互作用が見つかりました。研究2では、この相互作用は同じ方向であったが、有意ではなかった。研究1のモデルの概要は次のとおりです。
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.75882 0.26368 21.840 < 2e-16 ***
condSuppression -1.69598 0.34549 -4.909 1.94e-06 ***
prej -0.01981 0.08474 -0.234 0.81542
condSuppression:prej 0.36342 0.11513 3.157 0.00185 **
そして、研究2のモデル:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.24493 0.24459 21.444 <2e-16 ***
prej 0.13817 0.07984 1.731 0.0851 .
condSuppression -0.59510 0.34168 -1.742 0.0831 .
prej:condSuppression 0.13588 0.11889 1.143 0.2545
「複製できなかったので、何も持っていないのではないか」と言う代わりに、私は2つのデータセットを結合し、データの調査対象のダミー変数を作成してから、インタラクションを実行しました研究ダミー変数を制御した後、再び。この相互作用は、それを制御した後でも重要であり、条件と嫌悪/ prejの間のこの双方向の相互作用は、研究ダミー変数との3方向の相互作用では修飾されないことがわかりました。
ベイジアン分析の紹介
これはベイジアン分析を使用する絶好の機会であると誰かに提案してもらいました。研究2では、事前情報として使用できる研究1の情報があります!このように、研究2は、研究1の通常の最小二乗法の結果である頻度主義者からのベイジアン更新を行っています。そこで、係数2の有益な事前分布を使用して、研究2モデルに戻って再分析します平均が研究1の推定値であり、標準偏差が研究1の標準誤差である場合の通常の事前分布。
これは結果の要約です:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.63 0.17 5.30 5.52 5.63 5.74 5.96
condSuppression -1.20 0.20 -1.60 -1.34 -1.21 -1.07 -0.80
prej 0.02 0.05 -0.08 -0.01 0.02 0.05 0.11
condSuppression:prej 0.34 0.06 0.21 0.30 0.34 0.38 0.46
sigma 1.14 0.06 1.03 1.10 1.13 1.17 1.26
mean_PPD 5.49 0.11 5.27 5.41 5.49 5.56 5.72
log-posterior -316.40 1.63 -320.25 -317.25 -316.03 -315.23 -314.29
調査2の分析から得られた相互作用については、かなり堅実な証拠が得られたようです。これは、単にデータを積み重ねて、スタディ番号をダミー変数としてモデルを実行したときに行ったことと一致しています。
反事実:最初にスタディ2を実行した場合はどうなりますか?
それは私に考えさせられました:最初に研究2を実行し、研究1のデータを使用して研究2に対する私の信念を更新したらどうでしょうか?上記と同じことを行いましたが、逆に、研究1のデータを分析するための事前手段および標準偏差として、頻度2、通常の最小二乗係数推定値、研究2からの標準偏差を使用して研究1のデータを再分析しました。要約結果は次のとおりです。
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.35 0.17 5.01 5.23 5.35 5.46 5.69
condSuppression -1.09 0.20 -1.47 -1.22 -1.09 -0.96 -0.69
prej 0.11 0.05 0.01 0.08 0.11 0.14 0.21
condSuppression:prej 0.17 0.06 0.05 0.13 0.17 0.21 0.28
sigma 1.10 0.06 0.99 1.06 1.09 1.13 1.21
mean_PPD 5.33 0.11 5.11 5.25 5.33 5.40 5.54
log-posterior -303.89 1.61 -307.96 -304.67 -303.53 -302.74 -301.83
繰り返しますが、相互作用の証拠が見られますが、必ずしもそうであるとは限りませんでした。両方のベイジアン分析のポイント推定値は、互いに95%の信頼できる間隔にさえないことに注意してください。ベイジアン分析からの2つの信頼できる間隔は、オーバーラップするよりもオーバーラップしないことが多くなります。
時間優先のベイジアン正当化とは
したがって、私の質問は次のとおりです。データがどのように収集および分析されたかの年代順を尊重するためにベイジアンが持っている正当化は何ですか?スタディ1から結果を取得し、スタディ2で有益な事前情報として使用するため、スタディ2を使用して信念を「更新」します。しかし、取得した結果が真のポピュレーション効果を持つ分布からランダムに取得されたと仮定した場合、なぜ研究1の結果に特権を与えるのですか?スタディ1の結果をスタディ2の優先順位として使用する代わりに、スタディ2の結果をスタディ2の優先順位として使用する理由は何ですか?分析を収集して計算した順序は本当に重要ですか?私にはそう思わないようです。これに対するベイジアンの正当化は何ですか?最初にスタディ1を実行したからといって、ポイント推定値が.17よりも.34に近いと考える必要があるのはなぜですか?
Kodiologistの回答への対応
コディオロジストは次のように述べました。
これらのポイントの2番目は、あなたがベイジアン大会から出た重要な出発点です。最初に事前に設定してから、両方のモデルをベイジアン式に適合させたわけではありません。1つのモデルを非ベイジアン方式で適合させ、それを他のモデルの事前確率に使用します。従来のアプローチを使用した場合、ここで見た順序への依存は見られません。
これに対処するために、すべての回帰係数の事前確率がである研究1および研究2のモデルを適合させました。変数は、0又は1を符号化された、実験条件のためのダミー変数でした。変数と同様に、結果は、両方の1から7までの7点尺度で測定したしたがって、私はそれが前の公正な選択だと思います。データがどのようにスケーリングされるかだけで、以前に示唆されたものよりもはるかに大きな係数を見るのは非常にまれです。cond
prej
これらの推定値の平均推定値と標準偏差は、OLS回帰の場合とほぼ同じです。調査1:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.756 0.270 5.236 5.573 5.751 5.940 6.289
condSuppression -1.694 0.357 -2.403 -1.925 -1.688 -1.452 -0.986
prej -0.019 0.087 -0.191 -0.079 -0.017 0.040 0.150
condSuppression:prej 0.363 0.119 0.132 0.282 0.360 0.442 0.601
sigma 1.091 0.057 0.987 1.054 1.088 1.126 1.213
mean_PPD 5.332 0.108 5.121 5.259 5.332 5.406 5.542
log-posterior -304.764 1.589 -308.532 -305.551 -304.463 -303.595 -302.625
そして研究2:
Estimates:
mean sd 2.5% 25% 50% 75% 97.5%
(Intercept) 5.249 0.243 4.783 5.082 5.246 5.417 5.715
condSuppression -0.599 0.342 -1.272 -0.823 -0.599 -0.374 0.098
prej 0.137 0.079 -0.021 0.084 0.138 0.192 0.287
condSuppression:prej 0.135 0.120 -0.099 0.055 0.136 0.214 0.366
sigma 1.132 0.056 1.034 1.092 1.128 1.169 1.253
mean_PPD 5.470 0.114 5.248 5.392 5.471 5.548 5.687
log-posterior -316.699 1.583 -320.626 -317.454 -316.342 -315.561 -314.651
これらの平均と標準偏差は、OLS推定値とほぼ同じであるため、上記の順序効果は依然として発生します。スタディ2を分析するときに、スタディ1の事後要約統計を事前にプラグインすると、スタディ2を最初に分析し、スタディ1を分析するための事前分布としてそれらの事後要約統計を使用する場合とは異なる最終事後を観察します
頻度係数の推定ではなく、ベイジアン平均と回帰係数の標準偏差を事前分布として使用しても、同じ次数効果が観察されます。それで、疑問が残ります:最初に来た研究を特権化するためのベイジアン正当化は何ですか?
rstanarm
またはスタンとして含める方法はありますか?:その質問は前にここに依頼されているように思えるstats.stackexchange.com/questions/241690/...
prej
、手順を誤解しない限り、例えば、真の母係数の最終推定値はどちらの方法でも同じです。