ベイズ推定量は選択バイアスの影響を受けませんか?
高次元での推定について論じているほとんどの論文、例えば全ゲノム配列データは、しばしば選択バイアスの問題を提起します。選択バイアスは、何千もの潜在的な予測子があるにもかかわらず、選択されるのはごくわずかであり、選択されたいくつかに対して推論が行われるという事実から生じます。したがって、プロセスは2つのステップで行われます。(1)予測子のサブセットを選択します。(2)選択セットに対して推論を実行します。たとえば、オッズ比を推定します。Dawidは、1994年のパラドックスペーパーで、不偏推定量とベイズ推定量に焦点を当てました。彼は問題を単純化して、治療効果かもしれない最大の効果を選択する。 次に、公平な推定者は選択バイアスの影響を受けると彼は言います。彼は例を使用しました:
次に
Zi∼N(δi,1),i=1,…,N
Ziはに対してバイアスされ。ましょう 、推定
(但し付勢されているが
確かに)
\ max \ {\ delta_1、\ delta_2、\ ldots、\ delta_N \}の場合。このステートメントは、ジェンセンの不等式で簡単に証明できます。私たちは知っていたならばそのため、
私は_ {\最大}、最大のインデックス
\ delta_iは、我々だけで使用する
Z_を{I _ {\最大}}公平であるその推定量として。しかし、これがわからないため、代わりに(積極的に)バイアスされる
\ gamma_1(\ mathbf {Z})を使用します。
δiZ=(Z1,Z2,…,ZN)Tγ1(Z)=max{Z1,Z2,…,ZN}
max{δ1,δ2,…,δN}imaxδiZimaxγ1(Z)
しかし、Dawid、Efron、および他の著者の懸念事項は、ベイズの推定者は選択バイアスの影響を受けないということです。を優先する場合、たとえば、ベイズ推定量はによって与えられ
ここで、、は標準ガウスです。δiδi∼g(.)δi
E{δi∣Zi}=zi+ddzim(zi)
m(zi)=∫φ(zi−δi)g(δi)dδiφ(.)
私たちは、新しい推定定義する場合はとして
何でもあなたが推定するのに選択しとは、選択がに基づいていた場合
と同じなります。これは、がで単調であるです。我々はまた、知っている shrinkes用語とゼロに向かって、δimax
γ2(Z)=max{E{δ1∣Z1},E{δ2∣Z2},…,E{δN∣ZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δi∣Zi}Ziddzim(zi)これにより、の正のバイアスの一部が減少し。しかし、ベイズ推定量は選択バイアスの影響を受けないと結論付けるにはどうすればよいでしょうか。本当にわかりません。
Zi