パーセンタイルの計算は、累積密度関数の評価と同じですか?


8

私は、パーセンタイルのアイデアから、たとえば実数線を超えてジャンプしようとしています(n番目のパーセンタイルは、データポイントのn%がその下にあり、100-n%がその上にある位置です) )、確率密度関数の下の面積の考え方。

一連の数値の50%パーセンタイルを知りたい場合は、数値の半分が下にあり、半分の数値が上にある点を見つけます。これが50%のパーセンタイルです。これで完了です。

Zスコアなど、分布からの50%パーセンタイルを知りたい場合は、累積分布関数を0から50まで評価すれば完了です。これは正しいと言っていますか?

これは直感的には正しいと思いますが、それを家にたたくには、いくらかの議論が必要です。または、完全にオフにすることもできます...

回答:


5

F(a)=af(x)dx

3
おそらく、OPがどれだけ近いかを指摘する価値があります。「CDFを評価する」のではなく、逆CDFを評価する必要があります。
Silverfish、2015年

1
とても近いが、これまでのところ... :)
Matt O'Brien、

一般に、CDFの逆関数(通常の意味での関数の逆関数)は存在しない場合があります。CDFのいわゆる一般化された逆(または疑似逆)を考慮する必要があります。
Danny Pak-Keung Chan

1

いいえ。基本的に、百分位数(またはp四分位数)の計算は、CDFの逆数を見つけることと同じです。

通常の意味では、CDFの逆は存在しない可能性があり、一般化された逆の概念を導入する必要があることに注意してください。議論を正確にするために、すべての定義を明確にします。

F:[,][0,1]

  1. x,y[,]x<yF(x)F(y)

  2. aRF(a)=limxa+F(x)

  3. F()=limxF(x)=0、および

  4. F()=limxF(x)=1です。

とで示されるの一般化された逆の少なくとも2つのバージョンがあり、これらは次のように定義されます。I n v 1 F I n v 2 FFInv1FInv2F

Inv1F:[0,1][,]、定義Inv1F(x)=inf{yF(y)x},

Inv2F:[0,1][,]、によって定義されます。Inv2F(x)=inf{yF(y)>x}

ここでは、という規則を採用しています。inf()=

私の記憶が正しければ、と、位数は単にとして定義されます。p[0,1]pInv1F(p)

もちろん、が厳密に増加し、連続している場合、一般化された逆の両方のバージョンは同じであり、関数の通常の逆に縮小されF - 1[ 0 1 ] [ - ] FF1:[0,1][,].

詳細:https : //people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdf

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.