単変量のランダム変数の平均は、常にその分位数関数の積分に等しくなりますか?


17

単変量のランダム変数の分位関数(逆累積分布関数)をp = 0からp = 1に統合すると、変数の平均が生成されることに気付きました。私は今までこの関係について聞いたことがありませんので、私は不思議に思っています:これは常に事実ですか?もしそうなら、この関係は広く知られていますか?

Pythonの例を次に示します。

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

回答:


26

LETランダム変数のCDFである逆CDFを書き込むことができるように、。積分では、置換、を取得しますX F 1 p = F x d p = F x d x = f x d xFXF1p=F(x)dp=F(x)dx=f(x)dx

01F1(p)dp=xf(x)dx=EF[X].

これは、連続分布に有効です。逆CDFには一意の定義がないため、他の分布には注意が必要です。

編集

変数が連続的でない場合、ルベーグ測度に関して絶対的に連続的な分布を持たないため、逆CDFの定義と積分計算の注意が必要です。たとえば、離散分布の場合を考えます。定義により、これはCDFが各可能な値でサイズステップを持つステップ関数であるものです。Pr Fx xFPrF(x)x

図1

この図は、スケーリングされたベルヌーイ分布のCDFを示しています。つまり、確率変数の確率はがに等しく、の確率がに等しくなります。とでのジャンプの高さは、確率を与えます。この変数の期待値は明らかに 4/3に等しくなり。2 1 / 3 0 2 / 3 2 0 2 0 × 1 / 3 + 2 × 2 / 3 = 4 / 3(2/3)21/302/32020×(1/3)+2×(2/3)=4/3

以下を要求することにより、「逆CDF」定義できます。F1

F1(p)=x if F(x)p and F(x)<p.

これは、もステップ関数であることを意味します。確率変数の可能な値、は長さ間隔で値を達成します。したがって、その積分は値合計することで得られますが、これは単なる予想です。 x F 1 x Pr Fx x Pr Fx F1xF1xPrF(x)xPrF(x)

図2

これは、前の例の逆CDFのグラフです。CDF でのとのジャンプは、と等しい高さでこれらの長さの水平線になり、その値に確率が対応します。(逆CDFは、間隔を超えて定義されません。)その積分は、高さと底の2つの長方形の合計で、高さと底 1、合計、以前のように。2 / 3 0 2 [ 0 1 ] 0 1 / 3 2 2 / 3 4 / 31/32/302[0,1]01/322/34/3

一般に、連続分布と離散分布が混在する場合、この構造に対応する逆CDFを定義する必要があります。高さ各離散ジャンプで、前述の式で与えられる長さ水平線を形成する必要があります。pp


変数の変更を間違えました。xはどこから来たのですか?
マスカルポーネ

3
@Mascarpone式の前のテキストを読んでください。私は:-)変数の変更に誤りがあると思いませんが、それは博覧会を明らかにするだろうと思うならば、私がいることを指摘して幸せになるとき、その後、。私はそれが必要だとは思わなかった。p=F(x)x=F1(p)
whuber

今私はそれを得た;)、
マスカルポーネ

+1 Whuber:ありがとう!あなたが与えた式を使用するために、逆CDFが一意の定義を持たない他の分布に注意する方法を詳しく説明してもらえますか?
ティム

1
逆、擬似逆などに関するこのような不安な考慮事項をバイパスし、同時にすべての瞬間の一般化については、こちらを参照してください
DID

9

同等の結果が生存分析でよく知られています。予想される寿命はここで、生存関数は、出生から測定されたです。(負の値をカバーするように簡単に拡張できます。)

t=0S(t)dt
S(t)=Pr(T>t)t=0t

ここに画像の説明を入力してください

したがって、これを書き換えることができしかし、これは 問題の領域のさまざまな反射に示される

t=0(1F(t))dt
q=01F1(q)dq

ここに画像の説明を入力してください


1
私は写真が好きで、本能的にはここに潜んでいる素晴らしいアイデアがあると感じます-私そのアイデアを愛しています- しかし、私はこれらの特定のものを理解していません。説明が役立つでしょう。私のトラックで私を止める1つのことは、の積分をに拡張しようとする考えです。それは発散しなければなりません。(1F(t))dt
whuber

@whuber:負のに拡張したい場合、。これがに関して対称な分布、つまり収束する場合、期待値がゼロであることが簡単にわかることに注意してください。差ではなく合計を取るは、約平均絶対偏差を与え。tt=0(1F(t))dtt=0F(t)dt0F(t)=1F(t)t=0(1F(t))dt+t=0F(t)dt0
ヘンリー

ダイアグラムが好きな人は、リーのこの1988年の論文に興味があるかもしれません:損失カバレッジの超過の数学と遡及的評価-グラフィカルなアプローチ
アヴラハム14年

4

私たちは評価しています:

ここに画像の説明を入力してください

変数の簡単な変更を試してみましょう。

ここに画像の説明を入力してください

そして、PDFとCDFの定義により、次のことがわかります。

ここに画像の説明を入力してください

ほとんどどこでも。したがって、期待値の定義により、次のようになります。

ここに画像の説明を入力してください


最後の行で、期待値の定義をより明確に説明します。ほぼどこでも、最後の方程式を参照しています。en.wikipedia.org/wiki/Almost_everywhere
マスカルポーネ

1
編集、感謝:)
マスカルポーネ

3

任意の実数値の確率変数のための CDFとはよく知られていることをより同法有する場合上に均一である。したがって、の期待値は、存在する場合は常に、の期待値と同じです: 表現、一般的な累積分布関数に当てはまる取る、左連続逆であることがの場合に、それは可逆ではありません。XF F1(U)XU(0,1)XF1(U)

E(X)=E(F1(U))=01F1(u)du.
XF1(U)FF1FF

1

はとして定義され、右連続関数であることに注意してください。はとして定義され ため右連続の理にかなっています。ましょう一様分布である。簡単にすることを確認することができ同じCDFを有するである、。が連続している必要はありません。したがって、。積分はリーマン–スティールチェス積分ですF(x)P(Xx)F1

F1(p)=min(x|F(x)p).
minU[0,1]F1(U)XFX X E | X | < E(X)=E(F1(U))=01F1(p)dp。必要な唯一の仮定は、の平均が存在することです()。XE|X|<

それは私の答えと同じです。
ステファンローラン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.