ベータ確率変数の逆正規CDFはどの分布に従うのですか?


14

以下を定義するとします:

XBeta(α,β)

YΦ1(X)

ここで、は標準正規分布のCDFの逆数です。Φ1

私の質問は次のとおりです続く単純な分布はありますか、それともを近似できますか?YYシミュレーション結果(以下に示す)に基づいて、およびが高い場合にが正規分布に収束するという強い疑念があるので、私は尋ねていますが、なぜ数学的にそうなるのかわかりません。(もちろん、場合、は均一で、Yは標準の法線になりますが、より高い値に当てはまるのはなぜですか?)Yαβα=1;β=1XY

これが法線に収束する場合、αに関して、その法線のパラメーターはどうなりますβか?(私は平均が可能だろうと期待しておりΦ1(αα+β)それはモードの変換なので、標準偏差はわかりません)。

(別の言い方をすれば、これは「Φ(Norm(μ,σ))はベータ分布に収束し、μある方向についてはσ」と尋ねることができますか?それが答えやすいかどうかわかりません)。

シミュレーション結果

ここで、結果が正常であると疑う理由を示します(数学でバックアップできないため)。シミュレーションはYqnormとでRで実行できますrnorm。たとえば、高いパラメーターα=3000および選択する場合β=7000

hist(qnorm(rbeta(5000, 3000, 7000)))

これは正常に見えqqnormShapiro-Wilk検定(正規性は帰無仮説)も同様に示唆します。

qqnorm(qnorm(rbeta(5000, 3000, 7000)))

shapiro.test(qnorm(rbeta(5000, 3000, 7000)))
#> 
#>  Shapiro-Wilk normality test
#> 
#> data:  qnorm(rbeta(5000, 3000, 7000))
#> W = 0.99954, p-value = 0.2838

正常性をもう少し詳しく調べるために、から5,000の値をシミュレートするたびに2,000回のシミュレーションYを実行し、それからテストを実行して正常と比較します。(5Kの値を選択したのはshapiro.test、それが最大の処理能力であり、標準からの逸脱を検出する能力を最大化するためです)。

分布が本当に正規である場合、p値は均一であると予想されます(nullがtrueであるため)。それらは確かに均一に近く、分布が正規に非常に近いことを示唆しています。

hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 3000, 7000)))$p.value))

いくつかの実験では、βが高いほど、分布が正規に近くなることが示されています(たとえば、正規からかなり離れていますが、試してみてください。αβrbeta(5000, 3, 7)hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 30, 70)))$p.value))


2
ここでは興味深いことは何も起こりません。βが大きくなるにつれて、それらが同じ比率のままである、または少なくともα /α + β 01から離れていると仮定しましょう。その後、ベータα β 分布は正規になり、任意の狭い範囲に集中します。 Φ - 1は、あなたが単にほぼ-通常の変数の線形変換を見ているそこ、微分され、本質的に直線的になります。この結果は、を行うにはそれ以外の何物でもありませんΦを- 1αβα/(α+β)01(α,β)Φ1Φ1ベータ版の配布に関する情報は追加されません。
whuber

1
@whuberそれは大きなβに対して理にかなっています(ベータに近い同等の正常よりもこれが正常に近いと思わせるシミュレーションがいくつかありましたが、再実行するとその時点で間違いがあったと思います)。α = 2に関する考え。β = 2?距離は通常とはかけ離れていますが、その基準はかなり近いです。αβα=2β=2
デビッドロビンソン

1
@whuber Eg try hist(replicate(1000, shapiro.test(rbeta(5000, 2, 2))$p.value))、then hist(replicate(1000, shapiro.test(qnorm(rbeta(5000, 2, 2)))$p.value))。つまり、の場合はベータが均一であるため正常であり、αβが高い場合はベータがほぼ正常であるためです。正常か均一か?α=β=1αβ
デビッドロビンソン

5
それは間違いなくもっと面白いです!ベータは正常に非常に近くないが、ベータの小さなパラメータであっても、変換はほぼ正常であることは正しい。正規性からの偏差は、以上の裾で明らかになりますが、分布の全体にわたって非常に小さくなっています。最終的に、これはベータテールのべき乗則の動作に追跡可能です。Z=±3
whuber

回答:


7

あらすじ

サンプル中央値の中央極限定理で説明されている構造の一部を再発見しました。これは、サンプルの中央値の分析を示しています。(分析は、必要な変更を加えて、中央値だけでなく任意の分位数に明らかに適用れます)。したがって、大きなベータパラメータ(大きなサンプルに対応)について、質問で説明されている変換の下で正規分布が発生することは驚くことではありません。興味深いのは、小さなベータパラメータでも分布がどれほど正規分布に近いかということです。 それは説明に値します。

以下に分析をスケッチします。この投稿を妥当な長さに保つために、多くの示唆に富む手振りが含まれます。重要なアイデアを指摘するだけです。したがって、ここで結果を要約します。

  1. βに近い場合、すべてが対称です。これにより、変換された分布はすでに正規に見えます。αβ

  2. フォームの関数もの小さな値について、最初の場所ではかなり正常に見えるα及びβ(いずれも超え設け1それらの比があまりなく、0または1に近い)。Φα1(x)(1Φ(x))β1αβ101

  3. 変換された分布の見かけ上の正規性は、その密度が(2)の関数を掛けた正規密度で構成されるためです。

  4. ようにβの増加、正規性からの逸脱は、ログ密度テイラー級数における残りの項で測定することができます。次数nの項は、αβn 2 / 2乗に比例して減少します。これは、最終的に、十分に大きいαβに対して、パワーn = 3以上のすべての項が比較的小さくなり、2次のみが残ることを意味します。これは、正規分布の対数密度です。αβn(n2)/2αβαβn=3

全体として、これらの動作は、小さなβであっても、iid Normalサンプルの非極端な変位値がほぼ正常に見える理由をうまく説明しています。αβ


分析

一般化することが有用である可能性があるので、聞かせて可能任意の我々が考えているものの、分布関数F = ΦFF=Φ

定義により、ベータα β 変数の密度関数は、g(y)(α,β)

yα1(1y)β1dy.

まかせ、確率積分は、の変換であり、X及び書き込みFの誘導体のためにFがいること、それは即時であり、Xは、に比例する密度を有していますy=F(x)xfFx

G(x;α,β)=F(x)α1(1F(x))β1f(x)dx.

これは強く単峰性の分布(ベータ)の単調変換であるため、がかなり奇妙でない限り、変換された分布も単峰性になります。それがどれほど標準に近いかを調べるために、その密度の対数を調べてみましょう。F

(1)logG(x;α,β)=(α1)logF(x)+(β1)log(1F(x))+logf(x)+C

ここで、は正規化の無関係な定数です。C

テイラー級数のの成分を展開して、値x 0(モードに近い)の周りに3を並べます。例えば、我々は拡大書き込むことができ、ログFなどをlogG(x;α,β)x0logF

logF(x)=c0F+c1F(xx0)+c2F(xx0)2+c3Fh3

いくつかのためのを持ちます| h | | x x 0 | log 1 F log fにも同様の表記を使用しますh|h||xx0|log(1F)logf

線形項

の線形項はそれにより(1)

g1(α,β)=(α1)c1F+(β1)c11F+c1f.

Gのモードのときx0、この式はゼロです。係数の連続関数であるので、そのノート X 0として、 αおよび βが変化する、モード X 0があまりにも連続的に変化します。さらに、 α βが十分に大きくなると、 c f 1項は比較的重要ではなくなります。我々は、制限を勉強することを目指す場合は α β のための α β一定の割合で滞在 γG(;α,β)x0αβx0αβc1fαβ α:βγ、したがって、一度だけすべての基点を選択できます。x0

γc1F+c11F=0.

良いケースは、、全体でα = βで、F0に関して対称である場合です。その場合には明らかであるX 0 = F 0 = 1 / 2γ=1α=βF0x0=F(0)=1/2

(a)極限では、テイラー級数の一次項が消滅し、(b)今説明した特別な場合では、一次項が常にゼロになる方法を実現しました。

二次項

これらは合計です

g2(α,β)=(α1)c2F+(β1)c21F+c2f.

その二次的な用語である正規分布と比較、我々は推定してもよい- 1 /2 gで2α β およその分散であり、Gxをその平方根で再スケーリングしてGを標準化しましょう。詳細は本当に必要ありません。この再スケーリングがxの係数を乗算することを理解することで十分です。(1/2)(xx0)2/σ21/(2g2(α,β))GGxによるテイラー展開における- 1 /2 gで2α β N / 2(xx0)n(1/(2g2(α,β)))n/2.

剰余項

ここにパンチラインがあります:テイラー展開の次数の項は、記法によれば、n

gn(α,β)=(α1)cnF+(β1)cn1F+cnf.

標準化後、

gn(α,β)=gn(α,β)(2g2(α,β))n/2).

両方のは、αβのアフィン結合です。分母をn / 2乗することにより、正味の動作はαおよびβのそれぞれで次数- n - 2 / 2になります。これらのパラメーターが大きくなると、2番目以降のテイラー展開の各項が漸近的にゼロに減少します。 特に、3次剰余項は任意に小さくなります。giαβn/2(n2)/2αβ

ケース正常ですF

この場合、f x は純粋に2次であるため、が標準Normalの場合、剰余項の消失は特に高速です。剰余項には何も寄与しません。したがって、の偏差G正常からは、単にとの偏差に依存F α - 11 - F β - 1と正常。Ff(x)GFα1(1F)β1

この偏差は、βが小さい場合でもかなり小さくなります。例として、α = βの場合を考えます。 Gは対称であり、次数3の項は完全に消滅します。剰余は、x x 0 = xの次数4です。 αβα=βG4xx0=x

以下は、小さな値で標準化された4次項がどのように変化するかを示すプロットです。α>1

図

値から始まりのためにα = β = 1(その後分布は明らかに正常であるため、Φ - 1ベータもので均一な分布に適用1 1 であり、標準正規分布を与えます)。急速に増加しますが、0.008未満で終了します。これは実質的にゼロと見分けがつきません。その後、漸近的な相互減衰が始まり、α2を超えて増加するにつれて、分布は常に正規に近づきます。0α=β=1Φ1(1,1)0.008α2


2

収束

その仮定としましょうα とどんな小さな取るε > 0を。次に、v a r X 0。チェビシェフの不等式により、P [ | X 0.5 | > ε ] 0およびP [ | Y | > ε ] 0。これは、Yが確率で収束することを意味します(分布ではなくα=βαε>0var(X)0P[|X0.5|>ε]0P[|Y|>ε]0Y 実際には、分布が収束します-シングルトンへ)。

正確な分布

表すベータ分布の密度。変数Yの密度は、 f Yy = f XΦ y ϕ y です。Φには閉じた形がない ので、これは(分析的に)取得できる最も遠いものだと思います。Wolfram Mathematicaで関数に入れて、より良い形が見つかるかどうかを確認できます。fXY

fY(y)=fX(Φ(y))ϕ(y).
ΦFullSimplify

ここにRの密度がありますので、ヒストグラムの代わりにプロットできます。

f_y <- function(x, alpha, beta) {
  dbeta(pnorm(x), alpha, beta) * dnorm(x)
}

変形

しかし、あなたは多分の分布に興味がある 。(まだα=βと仮定)これはvar

Z=Φ1(αX)
α=β(それは)ゼロではないので、有用です。var(αX)1/8

1

kNk2XBeta(k,k)Y=Φ1(X)

n=2k1nU1,,UnU(1)U(n)

U(k)Beta(k,n+1k)

U(k)Beta(k,k)

nBeta(k,k)

Zi=Φ1(Ui)ZiZiZ(1)Z(n)Φ1

Φ1(U(k))=Z(k)

Yn

kkk=2

ab

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.