この質問は、1970年代にEfron&Morrisによって書かれたEmpirical BayesコンテキストのJames-Stein推定量に関する古典的な一連の論文で明示的に回答されました。私が主に言及しているのは:
エフロンとモリス、1973年、スタインの推定ルールとその競合他社-経験的ベイズアプローチ
エフロンとモリス、1975年、スタインの推定量によるデータ分析とその一般化
エフロンとモリス、1977、スタインの統計学におけるパラドックス
c
しかし、エルサルバドルの多くの都市におけるトキソプラズマ症の発生率を推定するという別の例を挙げます。各都市では異なる数の人々が調査されたため、個々の観測値(各都市のトキソプラズマ症率)は異なる分散を持つと考えることができます(調査される人々の数が少ないほど、分散が高くなります)。直感は、分散が小さい(不確実性が低い)データポイントは、分散が大きい(不確実性が高い)データポイントほど強く縮小する必要がないことは確かです。それらの分析の結果を次の図に示します。これは実際に起こっていることがわかります。
同じデータと分析が、はるかに技術的な1975年の論文にも、よりエレガントな図で示されています(残念ながら、個々の差異は示されていません)。セクション3を参照してください。
Xi|θi∼N(θi,Di)θi∼N(0,A)
ADi=11/(1+A)(k−2)/∑X2jθiθ^i=(1−11+A)Xi=(1−k−2∑X2j)Xi,
Di≠1θ^i=(1−DiDi+A)Xi
AA^
DjA^ik
1973年の論文の関連するセクションはセクション8であり、少し読みにくいです。興味深いことに、彼らは上記のコメントで@guyが行った提案について明示的なコメントをしています:
x~i=D−1/2ixi,θ~i=D−1/2iθix~i∼N(θ~i,1)θiθ^i=(1−k−2∑[X2j/Dj])Xi.
Xi
A^i