ジェームズ・スタイン推定:どのようエフロンとモリス計算でした


18

ブラッドリー・エフロンとカール・モリスによる1977年のアメリカ科学論文「統計におけるスタインのパラドックス」で、ジェームズ・シュタイン収縮係数の計算について質問があります。

野球選手のデータを収集しましたが、以下に示します。

Name, avg45, avgSeason    
Clemente, 0.400, 0.346    
Robinson, 0.378, 0.298    
Howard, 0.356, 0.276    
Johnstone, 0.333, 0.222    
Berry, 0.311, 0.273    
Spencer, 0.311, 0.270    
Kessinger, 0.289, 0.263    
Alvarado, 0.267, 0.210    
Santo, 0.244, 0.269    
Swoboda, 0.244, 0.230    
Unser, 0.222, 0.264    
Williams, 0.222, 0.256    
Scott, 0.222, 0.303    
Petrocelli, 0.222, 0.264    
Rodriguez, 0.222, 0.226    
Campaneris, 0.200, 0.285    
Munson, 0.178, 0.316    
Alvis, 0.156, 0.200

avg45は打席で後の平均であり、記事ではyとして示されています。シーズン平均の終わりです。45yavgSeason

平均(ジェームス・スタイン推定)で与えられる Z = ˉ Y + C Y - ˉ Y と収縮率Cは(サイエンティフィック・アメリカン1977記事のページ5)で与えられる。 C = 1 - K - 3 σ 2z

z=y¯+c(yy¯)
c
c=1(k3)σ2(yy¯)2,

kk=18(yy¯)2avg45σ2c=0.212

σx2σy2σ2c=0.212

σ2


1
MAD(en.wikipedia.org/wiki/Median_absolute_deviation)がウェーブレットの縮小に多く使用されることは知っています。
ロビンジラール

回答:


19

σ245Yibinom(45,pi)pi^=Yi

p^inorm(mean=pi,var=pi(1pi)/45).

σ^2=p^(1p^)45,
p^
p^=11845i=11845Yi=Y¯.

これは、次のRコードで確認できます。データは次のとおりです。

y <- c(0.4, 0.378, 0.356, 0.333, 0.311, 0.311, 0.289, 0.267, 0.244, 0.244, 0.222, 0.222, 0.222, 0.222, 0.222, 0.2, 0.178, 0.156)

σ2

s2 <- mean(y)*(1 - mean(y))/45

σ^20.004332392

1 - 15*s2/(17*var(y))

c0.2123905k2k3


素晴らしい説明です。二項式の通常の近似が大好きです。
チェンバレンフォンチャ

14

c=0.212

Efron、B.&&Morris、C.(1975)。スタインの推定量とその一般化を使用したデータ分析。Journal of the American Statistics Association、70(350)、311-319 (pdfへのリンク)

またはより詳細

エフロン、B。&モリス、C。(1974)。スタインの推定量とその一般化を使用したデータ分析。R-1394-OEO、The RAND Corporation、1974年3月(pdfへのリンク)

312ページで、Efron&Morrisがこれらのデータのアークサイン変換を使用しているため、バッティング平均の分散がほぼ統一されていることがわかります。

> dat <- read.table("data.txt", header=T, sep=",")
> yi  <- dat$avg45
> k   <- length(yi)
> yi  <- sqrt(45) * asin(2*yi-1)
> c   <- 1 - (k-3)*1 / sum((yi - mean(yi))^2)
> c
[1] 0.2091971

z

> zi  <- mean(yi) + c * (yi - mean(yi))
> round((sin(zi/sqrt(45)) + 1)/2,3) ### back-transformation
[1] 0.290 0.286 0.282 0.277 0.273 0.273 0.268 0.264 0.259
[10] 0.259 0.254 0.254 0.254 0.254 0.254 0.249 0.244 0.239

これらがスタイン推定量の値です。Clementeの場合、.290を取得します。これは、1977年の記事の.294に非常に近い値です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.