ブラウン橋の最高点にコルモゴロフ–スミルノフ分布があるのはなぜですか?


16

コルモゴロフ–スミルノフ分布は、コルモゴロフ–スミルノフ検定から知られています。しかし、それはブラウン橋の最高点の分布でもあります。

これは(私には)明らかではないので、この偶然の直観的な説明をお願いしたいと思います。参照も歓迎します。


@GaBorgulya:何を変えましたか?
ラスマス

こちらこちらをご覧ください。
枢機

回答:


13

nsupx|FnF|=supx|1ni=1nZi(x)|

ここで、Zi(x)=1XixE[1Xix]

CLTにより、 Gn=1ni=1nZi(x)N(0,F(x)(1F(x)))

これは直感です...

ブラウン橋は分散t 1 t )があります http://en.wikipedia.org/wiki/Brownian_bridge tF x )に置き換えます。これは1つのxです...B(t)t(1t) tF(x)x

また、共分散をチェックする必要があるため、(G nx 1G nx kB 1B kここで、B 1B kN0 Σ )でx1,,xk(Gn(x1),,Gn(xk))(B1,,Bk)(B1,,Bk)N(0,Σ) σ I J = F X IF XのJ- F X IF XのJΣ=(σij)σij=min(F(xi),F(xj))F(xi)F(xj)

難しい部分は制限のsuppremumの分布が限度の分布のsupremumであることを示すことである...これはなぜ起こるか理解することは、そのようなWaartとWelner(容易ではない)デア・バンなどの本を読んで、いくつかの経験的なプロセスの理論が必要です。定理の名前はドンスカー定理http://en.wikipedia.org/wiki/Donsker%27s_theorem ...


CLTをすべての有限次元周辺分布に適用するべきではありませんか?
ラスマス

あなたは直感的な答えを求めました:)また、すべてのtの収束が最高の収束(法則)を意味することを示すことであるトリッキーな数学的な部分であなたを煩わせないことを選択します...答えますか?
ロビンギラード

親愛なるロビン・ジラール、あなたの答えは現状のままで良いと思います。ありがとうございました!
ラスマス

1
難しい部分は、実際には弱い収束を示すことです。その後、連続写像定理から直接、上限の収束が続きます。この結果は、ビリングスリーの「確率測定の収束」で見つけることができます。Van der VaartとWellnerがより一般的な結果を出しており、彼らの本は本当に、本当に厳しいです:)
mpiktas

@robingirard私は個人的に、すべての「トリッキーな数学部分」で「完全な答え」を見たいと
思います-StatsPlease

6

コルモゴロフ-スミルノフの場合、帰無仮説を考慮してください。サンプルは特定の分布から引き出されるという。したがって、次の経験的分布関数を構築するとn サンプル fバツ=1nχバツ]バツ、無限データの限界では、基礎となる分布に収束します。

情報が限られている場合、オフになります。測定値の1つがq、そして バツ=q経験的分布関数はステップアップします。これは、真の分布関数で開始および終了するように制約されたランダムウォークと見なすことができます。それを知ったら、ランダムウォークについて知られている膨大な量の情報について文献を調べ、そのようなウォークの最大の予想される逸脱が何であるかを見つけます。

あなたは同じトリックを行うことができます p-経験的分布関数と基礎となる分布関数の差のノルム。にとってp=2, it's called the Cramer-von Mises test. I don't know the set of all such tests for arbitrary real, positive p form a complete class of any kind, but it might be an interesting thing to look at.

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.