ベイズ推定量は選択バイアスの影響を受けない


11

ベイズ推定量は選択バイアスの影響を受けませんか?

高次元での推定について論じているほとんどの論文、例えば全ゲノム配列データは、しばしば選択バイアスの問題を提起します。選択バイアスは、何千もの潜在的な予測子があるにもかかわらず、選択されるのはごくわずかであり、選択されたいくつかに対して推論が行われるという事実から生じます。したがって、プロセスは2つのステップで行われます。(1)予測子のサブセットを選択します。(2)選択セットに対して推論を実行します。たとえば、オッズ比を推定します。Dawidは、1994年のパラドックスペーパーで、不偏推定量とベイズ推定量に焦点を当てました。彼は問題を単純化して、治療効果かもしれない最大の効果を選択する。 次に、公平な推定者は選択バイアスの影響を受けると彼は言います。彼は例を使用しました: 次に

ZiN(δi,1),i=1,,N
Ziはに対してバイアスされ。ましょう 、推定 (但し付勢されているが確かに\ max \ {\ delta_1、\ delta_2、\ ldots、\ delta_N \}の場合。このステートメントは、ジェンセンの不等式で簡単に証明できます。私たちは知っていたならばそのため、私は_ {\最大}、最大のインデックス\ delta_iは、我々だけで使用するZ_を{I _ {\最大}}公平であるその推定量として。しかし、これがわからないため、代わりに(積極的に)バイアスされる\ gamma_1(\ mathbf {Z})を使用します。δiZ=(Z1,Z2,,ZN)T
γ1(Z)=max{Z1,Z2,,ZN}
max{δ1,δ2,,δN}imaxδiZimaxγ1(Z)

ここに画像の説明を入力してください

しかし、Dawid、Efron、および他の著者の懸念事項は、ベイズの推定者は選択バイアスの影響を受けないということです。を優先する場合、たとえば、ベイズ推定量はによって与えられ ここで、、は標準ガウスです。δiδig(.)δi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδiφ(.)

私たちは、新しい推定定義する場合はとして 何でもあなたが推定するのに選択しとは、選択がに基づいていた場合 と同じなります。これは、がで単調であるです。我々はまた、知っている shrinkes用語とゼロに向かって、δimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δiZi}Ziddzim(zi)これにより、の正のバイアスの一部が減少し。しかし、ベイズ推定量は選択バイアスの影響を受けないと結論付けるにはどうすればよいでしょうか。本当にわかりません。Zi

1
文献でクレームを参照している場合、このクレームの完全なコンテキストを読み取ることができるように、完全な状況とページの参照を提供してください。
ベン-モニカを

ベイズ推定器の最大値として推定器を定義することはまだベイズ推定器ですか?
西安

論文の例1。
Chamberlain Foncha 2018年

回答:


4

上記のように、この問題は、正常なrvのサンプルの最大平均のインデックスと値(i⁰、μ⁰)を推測することで成り立ちます。Dawidのプレゼンテーションで私が驚いたのは、ベイジアン分析はそれほどベイジアンに聞こえないということです。サンプル全体が与えられた場合、ベイジアンアプローチでは、i⁰の推定から関連する平均の推定までの推定手順に従うのではなく、(i⁰、μ⁰)に事後分布を作成する必要があります。必要に応じて、推定量は特定の損失関数の定義から取得する必要があります。代わりに、サンプルで最大のポイントが与えられ、そのポイントのみが与えられると、その分布が変化するので、調整は必要ないというステートメントにかなり戸惑います。

これらの平均が比較され、したがって比較可能であるため、平均の事前分布は、独立した法線の積ではなく合同である必要があるという点で、事前のモデリングもかなり意外です。たとえば、階層的事前分布の方が適切であるように思われ、場所とスケールはデータ全体から推定されます。手段間の接続を作成する...独立した不適切な事前分布を使用することに関連する異議は、最大平均μ⁰が明確に定義されていないことです。しかし、私は、いくつかの前のものに対する他のものに対する批判がこの「パラドックス」への関連攻撃であるとは思いません。


1
必要なすべての保護は、すべての未知の手段を接続する以前にコーディングする必要があるように思えます。事前確率が平均値の間に大きな違いを生じさせる可能性が非常に低い場合、それは事後確率に反映され、完璧になります。
フランクハレル2018年

@ Xi'anは、事前に配置する方法の例を示すことができますか?(i,μ)
Chamberlain Foncha

@フランク・ハレル、たとえばおよび考えてみましょう。の不偏推定量 はです。のベイズ推定量はです。ifが最大の、です。これは、ベイズ推定器がで単調であるです。以前の情報がどれほど有益であっても、これは変わりません。しかし、の正ベイズ削減。しかし、間違ったが選択された場合、ベイズ推定器はこれを修正できません。δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
Chamberlain Foncha

@ChamberlainFoncha:が演繹的に独立している場合、ベイズ推定器はのみです。との前のジョイントは、それらを実際に依存させます。E[δi|Zi]δiiμi
西安

そして、ベイズの観点からは、どのような事前分布も受け入れられます。たとえば、インデックスの均一分布との階層的事前分布です。μi
西安

1

少し直感に反する場合でも、ステートメントは正しいです。この実験のを想定すると、の事後は実際にはです。この直観に反する事実は、ベイズが(秘密の)早期停止に免疫を持っていることと少し似ています(これも非常に直感的です)。i=5μ5N(x5,σ2)

ベイズの推論は、そのような実験ごとに(数回繰り返すと想像してください)、最良の多様性の結果のみが保持される場合、誤った結論を導きます。データ選択があり、ベイズ法は明らかに(秘密の)データ選択の影響を受けません。実際、データの選択に影響されない統計的手法はありません。

このような選択が行われた場合、この選択を考慮した完全なベイズの推論は簡単に錯覚を修正します。

ただし、「ベイズ推定量は選択バイアスの影響を受けない」という文は少し危険です。「選択」が、たとえば説明変数の選択やデータの選択など、他の何かを意味する状況を想像するのは簡単です。ベイズは明らかにこれに影響されません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.