これにはさまざまなアプローチをとることができますが、どのアプローチも一部の人には直感的で、他の人には直感的ではないように思えます。このような変化に対応するため、この回答では、数学的思考の主要な区分である分析(無限および無限)、幾何学/トポロジー(空間関係)、および代数(記号操作の形式的パターン)をカバーするいくつかのアプローチを調査します。確率自体も。最後に、4つのアプローチすべてを統合し、ここで答えるべき真の質問があることを示し、問題が何であるかを正確に示す観察結果に至ります。各アプローチは、独自の方法で、独立した均一変数の合計の確率分布関数の形状の性質に関するより深い洞察を提供します。
バックグラウンド
制服分布は[0,1]、いくつかの基本的な説明があります。とき、このような分布を有しています、X
チャンスという測定可能なセットにあるのちょうど措置(長さ)である、書かれた。A A ∩ [ 0 、1 ] | A ∩ [ 0 、1 ] |XAA∩[0,1]|A∩[0,1]|
このことから、累積分布関数(CDF)は
FX(x)=Pr(X≤x)=|(−∞,x]∩[0,1]|=|[0,min(x,1)]|=⎧⎩⎨⎪⎪0x1x<00≤x≤1x>1.
CDFの誘導体である確率密度関数(PDF)は、あるのためのとそれ以外の場合。(およびでは未定義です。)fX(x)=10≤x≤1fX(x)=001
特性関数からの直観(分析)
任意のランダム変数の特性関数(CF)は、の期待値です(は虚数単位、)。一様分布のPDFを使用して計算できますXexp(itX)ii2=−1
ϕX(t)=∫∞−∞exp(itx)fX(x)dx=∫10exp(itx)dx=exp(itx)it∣∣∣x=1x=0=exp(it)−1it.
CFは(バージョンの)PDFのフーリエ変換、です。フーリエ変換に関する最も基本的な定理は次のとおりです。ϕ(t)=f^(t)
f(x)=ϕˇ(x)=12π∫∞−∞exp(−ixt)ϕ(t)dt.
場合微分可能であり、その誘導体は、積分記号の下に計算することができます。f
f′(x)=ddx12π∫∞−∞exp(−ixt)ϕ(t)dt=−i2π∫∞−∞texp(−ixt)ϕ(t)dt.
これを明確にするには、最後の積分が完全に収束する必要があります。あれは、
∫∞−∞|texp(−ixt)ϕ(t)|dt=∫∞−∞|t||ϕ(t)|dt
有限値に収束する必要があります。逆に、収束すると、これらの反転式により微分はどこにでも存在します。
均一変数の合計に対するPDFの微分可能性が明確になりました。最初の箇条書きから、iid変数の合計のCFは乗した変数のCFです。ここに等しい。分子は境界があり(正弦波で構成されます)、分母はです。このような被積分関数にを掛けることができますが、 場合は絶対的に収束し、場合は条件付きで収束します。したがって、3番目の箇条書きを繰り返し適用すると、一様変量の合計のPDFは連続的になることがわかります。nnth(exp(it)−1)n/(it)nO(tn)tss<n−1s=n−1nn−2微分可能であり、ほとんどの場所で、倍微分可能です。n−1
青い網掛けの曲線は、 iidの一様変量の和のCFの実数部の絶対値の対数プロットです。赤い破線は漸近線です。その勾配はで、PDF が倍微分可能であることを示しています。参考のため、灰色の曲線は、同様の形状のガウス関数(通常のPDF)のCFの実数部をプロットしています。n=10−1010−2=8
確率からの直観
ましょうおよび、独立したランダム変数である制服がある分布を。狭い間隔考えてみましょう。私たちは、そのチャンス分解する機会に十分に近いこの間隔倍の可能性であるちょうどいい大きさですが十分に近い場合、この間隔にを配置するには:YXX[0,1](t,t+dt]X+Y∈(t,t+dt]YXX+YY
fX+Y(t)dt=Pr(X+Y∈(t,t+dt])=Pr(X+Y∈(t,t+dt]|Y∈(t−1,t+dt])Pr(Y∈(t−1,t+dt])=Pr(X∈(t−Y,t−Y+dt]|Y∈(t−1,t+dt])(FY(t+dt)−FY(t−1))=1dt(FY(t+dt)−FY(t−1)).
最終的な等式はのPDFの式から得られます。で両側を割るとしての限界を取って与えますXdtdt→0
fX+Y(t)=FY(t)−FY(t−1).
つまり、Uniform変数を任意の変数に追加すると、pdfが差分CDFます。PDFはCDFの導関数であるため、これは独立した均一変数をに追加するたびに、結果のPDFが以前よりも1回微分可能になることを意味します。[0,1]XYfYFY(t)−FY(t−1)Y
ユニフォーム変数から始めて、この洞察を適用してみましょう。元のPDFはまたは微分できません。そこでは不連続です。PDFで微分可能ではない、、又は、それは、これらの点で連続的である必要があり、それはのPDFの積分の差であるので、。別の独立した均一な変数追加:のPDFあるで微分、、、及びそれ-しかし、必ずしも有していない第二のY01Y+X012YX2Y+X+X2 0123それらのポイントでのデリバティブ。等々。
ジオメトリからの直観
一様変量の和のでのCDFは、半空間内にあるユニットハイパーキューブの体積に等しくなります。用状況変量を用いて、ここに示されに設定、、次いで。tn[0,1]nx1+x2+⋯+xn≤tn=3t1/23/25/2
から進行を介して、超平面交差頂点における、。断面の形状が変わるたびに、図では最初に三角形(シンプレックス)、次に六角形、次に三角形になります。 これらの値でPDFに鋭い曲げがないのはなぜですか?t0nHn(t):x1+x2+⋯+xn=tt=0t=1,…,t=n2t
これを理解するには、まず小さな値を考慮します。ここで、超平面はシンプレックスを切断します。シンプレックスの次元はすべてに直接比例し、その「面積」は比例します。このためのいくつかの表記法は後で役立ちます。してみましょう「単位ステップ関数」でtHn(t)n−1n−1ttn−1θ
θ(x)={01x<0x≥0.
ハイパーキューブの他のコーナーが存在しない場合、このスケーリングは無期限に継続します。シンプレックスの面積のプロットは、次の青い実線の曲線のようになります。負の値ではゼロで、等しくなります正の値で、便利に書かれてい。原点に次の「キンク」があり、次までのすべての導関数が存在して連続しているという意味で、次の左右の導関数は存在するが、原点では一致しないという意味で。n−1tn−1/(n−1)!θ(t)tn−1/(n−1)!n−2n−3n−2
(この図に示されている他の曲線は、(赤)、 (金)、および (黒)の場合の役割については、以下でさらに説明します。)−3θ(t−1)(t−1)2/2!3θ(t−2)(t−2)2/2!−θ(t−3)(t−3)2/2!n=3
が横切ったときに何が起こるかを理解するために、すべてのジオメトリが平面内で発生するのケースを詳細に調べてみましょう。以下に示すように、ユニット「キューブ」(現在は単なる正方形)を象限の線形結合として見ることができます。t1n=2
最初の象限が左下のパネルに灰色で表示されます。の値は、5つのパネルすべてに表示される対角線を決定します。CDFは、右側に示されている黄色の領域と同じです。この黄色の領域は次のもので構成されています。t1.5
左下のパネルの三角形の灰色の領域、
左上のパネルの三角形の緑色の領域を引いて、
低い中央のパネルの三角形の赤い領域を引いて、
さらに、上部中央パネルの青色の領域(ただし、そのような領域は存在せず、がを超えるまで存在しません)。t2
これらのエリアはすべて三角形のエリアです。以下のような最初のスケール、次の二つがゼロであるとそうでないようなスケール、そして最後はゼロであり、その他の場合はようにスケールします。この幾何学的分析により、CDFは = ; 同様に、PDFは3つの関数、、およびの合計に比例します2n=4tn=t2t<1(t−1)n=(t−1)2t<2(t−2)nθ(t)t2−θ(t−1)(t−1)2−θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t2−2θ(t−1)(t−1)2+θ(t−2)(t−2)2θ(t)t−2θ(t−1)(t−1)θ(t−2)(t−2)(場合、それぞれが線形にスケーリングします)。この図に示すそれらのグラフの左のパネル:明らかに、彼らは元のグラフのすべてのバージョンであるが、()だけシフト、、および右及び(B)に単位がによって再スケーリング、、およびです。n=2θ(t)t0121−21
右側のパネルは、これらのグラフの合計を示しています(黒一色の曲線、単位面積を持つように正規化されています:これは、元の質問で示されている角度の見えるPDFです)。
これで、PDFのiidユニフォーム変数の合計の「キンク」の性質を理解できます。 これらはすべて、関数で発生する「キンク」とまったく同じであり、おそらく再スケーリングされ、整数シフトされますは超平面は、ハイパーキューブの頂点を交差します。以下のために、これは方向における目に見える変化である:右誘導体でであるの左誘導体である。以下のために、これは、連続0θ(t)tn−11,2,…,nHn(t)n=2θ(t)t001n=3方向は変化しますが、二次導関数の突然の(不連続な)変化です。一般的なについては、次まで連続微分がありますが、微分には不連続があり。nn−2n−1st
代数的操作からの直観
CFを計算するための統合、確率的分析における条件付き確率の形式、および象限の線形結合としてのハイパーキューブの合成はすべて、元の均一分布に戻り、それをより単純なものの線形結合として再表現することを示唆しています。確かに、そのPDFは書くことができます
fX(x)=θ(x)−θ(x−1).
シフト演算子導入しましょう:グラフを右に1単位シフトすることにより、任意の関数作用します:Δf
(Δf)(x)=f(x−1).
形式的には、一様変数 PDFについて、次のように記述できます。X
fX=(1−Δ)θ.
のユニフォームの合計のPDFは、とそれ自体の回の畳み込みです。これは、ランダム変数の合計の定義から得られます。2つの関数と畳み込みは、nfXnfg
(f⋆g)(x)=∫∞−∞f(x−y)g(y)dy.
畳み込みがと交換することを確認するのは簡単です。積分の変数をから変更するだけです:Δyy+1
(f⋆(Δg))=∫∞−∞f(x−y)(Δg)(y)dy=∫∞−∞f(x−y)g(y−1)dy=∫∞−∞f((x−1)−y)g(y)dy=(Δ(f⋆g))(x).
iidユニフォームの合計のPDFについては、次のように代数的に進めます。n
f=f⋆nX=((1−Δ)θ)⋆n=(1−Δ)nθ⋆n
( "power"は、点ごとの乗算ではなく、反復畳み込みを示します!)。現在、は直接的な基本積分であり、⋆nθ⋆n
θ⋆n(x)=θ(x)xn−1n−1!.
残りは代数です。二項定理が適用されるためです(実数上の可換代数でのように)。
f=(1−Δ)nθ⋆n=∑i=0n(−1)i(ni)Δiθ⋆n.
ので単ににより引数をシフト、この展示のPDFのシフトされたバージョンの線形結合として、正確に我々は、幾何学的に推定されます。Δiifθ(x)xn−1
f(x)=1(n−1)!∑i=0n(−1)i(ni)(x−i)n−1θ(x−i).
(ジョンクックは、ブログ投稿でこの式を引用し、の表記を使用しています。)(x−i)n−1+(x−i)n−1θ(x−i)
したがって、はどこでも滑らかな関数であるため、PDFの特異な動作はが特異な場所(明らかに)および右にシフトした場所でのみ発生します。。 したがって、その特異な動作の性質-平滑度-は、すべての箇所で同じになります。xn−1θ(x)01,2,…,nn+1
これを示すのは、で、左のパネルに合計の個々の用語と(右のパネルに)部分的な合計が表示され、合計自体に達します(黒の実線の曲線)。n=8
最後のコメント
この最後のアプローチにより、最終的に iid均一変数の合計のPDFを計算するためのコンパクトで実用的な式が得られたことに注意してください。(CDFの式も同様に取得されます。)n
中心極限定理はここで言うことはほとんどありません。結局、iid Binomial変数の合計は正規分布に収束しますが、その合計は常に離散的です。PDFさえまったくありません!PDFの「ねじれ」または微分可能性の他の尺度についての直観がCLTから来ることを期待しないでください。