データのCDFを別のCDFとクロスさせることはできますか


8

正の実数XとYの2つのデータセットがあり、どちらも同じサイズで、各行が0 <= Y <= Xであるとします。Xの経験的CDFがYの経験的CDFと交差することはありますか?

回答:


4

経験的累積分布関数はで以下のサンプルの割合である、TF^(t)t

を増やして行を並べ替えることを検討してください(固定値yの場合は、xを増やして並べ替えます)。yyx

次に、そのような行(行など)ごとに、各cdfの高さはi / n *で、xサンプルの対応する横座標は常にyサンプルの横座標の右側にあります。ステップ関数は一致する可能性がありますが、xサンプルのecdfがyサンプルのecdfの上/左になることはありません。ii/n

ここに画像の説明を入力してください

実際、ecdf内のすべての垂直ジャンプを「プロット上で描く」ことを想像してください。次に、ある値でプロットを横切って描かれた水平線は、サンプル値を順番にリストする表に表示される特定の値yおよびxでecdfステップを打ちます(実際、特定のFの値に対して、それは簡単ですそれがされる行うまく常に有している)、Y IX のIFyxFyixi

*(値が重複している場合は少し複雑になりますが、実質的に引数を変更する方法ではありません)

F0.481ty=194.4503tx=200.0431


2

Glen_bの答えは正しいですが、これを実証するもっと簡単な方法があると思います。

xxx1,x2,,xny1,y2,,ynyixii

y1x1y1x11n1nyi>xiYX

YXYX


0

上記の内容を形式化してください。

FXFY

FX(x)=1nxiI(xix)FY(x)=1nyiI(yix)

xI(xix)I(yix)x(xi,yi)yi>xi

FX(x)FY(x)x

注:このデモには、データポイントの数が有限であるという暗黙の前提があります。同じサイズ(すなわち、カーディナリティー)の無限のデータ・セットを持つことは可能だと思います。私は結果が保持されることをかなり確信していますが、そのような結果の証明についてははるかに確実ではありません。


無限に多くのデータポイントがある場合、実証的なCDFをどのように定義しますか?
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.