均一な和分布の正規近似の誤差


20

正規分布を近似するための単純な方法の1つは、中央限界定理に基づいて、に均一に分布したおそらく IIDランダム変数を加算し、次にリセンタして再スケーリングすることです。(補足Box-Muller変換など、より正確な方法があります。)IID確率変数の合計は、均一合計分布またはIrwin-Hall分布として知られています。[ 0 1 ]100[0,1]U(0,1)

正規分布によって均一な和分布を近似する際の誤差はどれくらいですか?

このタイプの質問がIIDランダム変数の合計を近似するために出てくるときはいつでも、人々(私を含む)はベリーエッセンの定理を持ち出します。

|Fn(x)Φ(x)|Cρσ3n

ここで、は IIDランダム変数の再スケーリングされた合計の累積分布関数、は絶対3次中心モーメント、は標準偏差で、はまたはことができる絶対定数です。のn ρ E | X E X 3 | σ C 1 1 / 2FnnρE|(XEX)3|σC11/2

これは不十分です。Berry-Esseenの推定は、離散的な二項分布で最もシャープに近く、対称二項分布では最大誤差がであるように思われます。最大のエラーは最大のジャンプで発生します。ただし、均一な合計分布にはジャンプがありません。0

数値テストは、エラーがよりも急速に縮小することを示唆しています。c/n

使用、ベリー- Esseen推定値である| F NX - Φ X | 1C=1/2

|Fn(x)Φ(x)|121321123n0.650n

そのため約ある、、およびそれぞれ。実際の最大の違いあるように見える約、、及びはるかに小さいとして入るように見える、それぞれ、の代わりに。0.205 0.145 0.103 、N = 10 20 40 0.00281 0.00139 0.000692 C / N 、C / n=10,20,400.2050.1450.103n=10,20,400.002810.001390.000692c/nc/n


7
Edgeworth展開で合計の分布を展開すると、が(均一な分布が対称であるため)ので、右約サウンド。以下のため ...あなたにかかわらず、拘束与えていない用語、X N のC / N O N - 1Fn(x)=Φ(x)+n1g(x)+o(n1)xnc/no(n1)
MånsT

1
おかげで、他の多くのディストリビューションのパターンも説明しているようです。c/n
ダグラスザーレ

回答:


17

ましょう BE IID確率変数と考える正規化和 および関連するノルム ここではの分布です。Ub b S n = U1,U2,U(b,b)SUP δ N = SUP のx R | F NX - Φ X |

Sn=3i=1nUibn,
supF n S n
δn=supxR|Fn(x)Φ(x)|,
FnSn

補題1ウスペンスキー):の次の境界がます。 δ N < 1δn

δn<17.5πn+1π(2π)n+12π3nexp(π2n/24).

証明。JVウスペンスキー(1937)、数学の確率の紹介、ニューヨーク:McGraw-Hill、p。305。

これは後にR. Shermanによって次のように改善されました。

補題2シャーマン):ウスペンスキー限界保持に関する以下の改善。

δn<17.5πn(π180+17.5πn)eπ2n/24+1(n+1)π(2π)n+12π3neπ2n/24.

証明:参照してくださいR.シャーマン、N確率変数の和に対する正規近似の誤差Biometrika、巻。58、いいえ。2、396–398。

証明は上三角不等式と古典的な境界の非常に簡単アプリケーションである正規分布の尾部上二つの分布のそれぞれの特徴的な機能に適用されます。(sinx)/x


2
+1 補題2 ではですか?N=n

@Procrastinator:良いキャッチ。
枢機

1
ありがとう!これらの参照は非常に役立ちます。推定値は、実際の値の倍以内にあるようです。2
ダグラスザーレ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.