不等分散のJames-Stein Estimator


11

James-Stein推定量について私が見つけたすべてのステートメントは、推定されている確率変数が同じ(および単位)分散を持っていると想定しています。

しかし、これらの例はすべて、JS推定器を使用して、互いに何の関係もなく数量を推定できることにも言及しています。ウィキペディアの例は、モンタナの光、台湾のお茶の消費量、および豚の体重の速度です。しかし、おそらくこれらの3つの量の測定値には、異なる「真の」分散があります。これは問題を引き起こしますか?

:この質問に関連し、私は理解していないという大きな概念問題にこのネクタイ、ジェームズ・スタイン推定:どのようエフロンとモリス計算でした彼らの野球例えば収縮率で?σ2収縮率は次のように計算します。c

c=1(k3)σ2(yy¯)2

直感的に、私は、と思うだろう項は、実際にあるσ 2 Iと推定されている各数量ごとに異なります- 。しかし、その質問の議論はプールされた分散の使用についてのみ話します...σ2σi2

誰かこの混乱を解消していただければ幸いです。


3
D=diag(σ12,,σn2)D1/2DmiDD^D^1/2
2014年

2
@guy:これは賢明な提案(+1)ですが、すべての変数に対して同じ縮小係数が得られますが、変数/不確実性に応じて、変数を異なる方法で縮小したいと思うでしょう。私が投稿したばかりの答えを見てください。
amoebaはモニカを復活させます14

1
@amoeba確かに; 私が私の推定者が実用的であると提案したのではなく、それが人々が彼/彼女の2番目の段落で言及されたOPを言う理由を説明しただけでした。
男14年

回答:


6

この質問は、1970年代にEfron&Morrisによって書かれたEmpirical BayesコンテキストのJames-Stein推定量に関する古典的な一連の論文で明示的に回答されました。私が主に言及しているのは:

  1. エフロンとモリス、1973年、スタインの推定ルールとその競合他社-経験的ベイズアプローチ

  2. エフロンとモリス、1975年、スタインの推定量によるデータ分析とその一般化

  3. エフロンとモリス、1977、スタインの統計学におけるパラドックス

c

しかし、エルサルバドルの多くの都市におけるトキソプラズマ症の発生率を推定するという別の例を挙げます。各都市では異なる数の人々が調査されたため、個々の観測値(各都市のトキソプラズマ症率)は異なる分散を持つと考えることができます(調査される人々の数が少ないほど、分散が高くなります)。直感は、分散が小さい(不確実性が低い)データポイントは、分散が大きい(不確実性が高い)データポイントほど強く縮小する必要がないことは確かです。それらの分析の結果を次の図に示します。これは実際に起こっていることがわかります。

ここに画像の説明を入力してください

同じデータと分析が、はるかに技術的な1975年の論文にも、よりエレガントな図で示されています(残念ながら、個々の差異は示されていません)。セクション3を参照してください。

ここに画像の説明を入力してください

Xi|θiN(θi,Di)θiN(0,A)
ADi=11/(1+A)(k2)/Xj2θi
θ^i=(111+A)Xi=(1k2Xj2)Xi,

Di1

θ^i=(1DiDi+A)Xi
AA^

DjA^ik

1973年の論文の関連するセクションはセクション8であり、少し読みにくいです。興味深いことに、彼らは上記のコメントで@guyが行った提案について明示的なコメントをしています:

x~i=Di1/2xi,θ~i=Di1/2θix~iN(θ~i,1)θi

θ^i=(1k2[Xj2/Dj])Xi.
Xi

A^i

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.