ベータ分布密度関数に-1があるのはなぜですか?


18

ベータ分布は2つのパラメーター化(またはここ)で表示されます

F X α X α1 - X β

f(x)xα(1x)β(1)

または、より一般的に使用されると思われるもの

F X α X α - 11 - X β - 1

f(x)xα1(1x)β1(2)

しかし、なぜ2番目の式に「11」があるのですか?

最初の定式化は直観的に二項分布に直接対応するように思われます

g k p k1 p n k

g(k)pk(1p)nk(3)

しかしppの観点から「見た」。これは、ベータ二項モデルでは特に明確であり、αα以前の成功数として、ββ以前の失敗数として理解できます。

では、なぜ第2の形式が正確に人気を得たのか、そしてその背後にある理論的根拠は何か?パラメータ化のいずれかを使用した結果はどうなりますか(たとえば、二項分布との接続の場合)。

誰かがそのような選択の起源とそのための最初の議論をさらに指摘できれば素晴らしいのですが、それは私にとって必要ではありません。


3
深い理由は中で示唆されたこの答え:等しい対策に対する。それはにあなたの質問を減らします」このメジャーがなぜあるのか??このメジャーがことを認識することは、これらの分布を理解する「正しい」方法を示唆します。ロジスティック変換を適用することである:「。」という用語は、その後消えますF X α1 - X β D μ = D X /X 1 - X D μ = D ログXfxα(1x)βdμ=dx/((x(1x))1 x1
dμ=d(log(x1x))
1
whuber

1
私はそれが起こった実際の理由は歴史的なものだと思います- それは分布が命名されたベータ関数でそのように見えるからです。それが力で持っている理由に関して、私はそれが最終的にwhuberが言及する理由に接続されると予想します(ただし、歴史的には測定や確率とは関係ありません)。11
Glen_b

2
@Glen_bそれは歴史的なことだけではありません。深い理由があります。彼らは、理由で指数に質問を減少、ベータとガンマ関数との間の密接な接続に起因するあるありません。これは、がガウス和であるためです。同様に、乗法群 Haar測度に対する乗法準同型倍の加法文字積分としてを表示することは「正しい」。Γ S = 0 T S - 1 E - T D T S - 1 S Γ Γ T T S T E - T D T / T R ×Γ(s)=0ts1etdts1sΓΓttstetdt/tR×
whuber

1
@whそれがガンマ関数がそのように選ばれるべき理由です(そして、私はすでにそのような理由が上に存在することを提案し、それに似た何らかの形式の推論を受け入れます-必然的に異なる形式で-オイラーの選択になりました); それに対応して、密度によって説得力のある理由が生じます。しかし、それが実際に選択の理由であることを確認するわけではありません(なぜフォームが選択されたのか)、それがそうする正当な理由であるということだけです。ガンマ関数の形式... ctd
Glen_b -Reinstate Monica

1
ctd ...だけで、密度や他の人が追随するためにそのフォームを選択するのに十分な理由になります。[多くの場合、選択は後で特定できる単純な理由で行われ、それ以外のことを行うには多くの場合、説得力のある理由が必要です。それが最初に選ばれた理由だと知っていますか?]-あなたは、なぜそうするのでなく、そのように密度を選ぶべきなのかという理由があることを明確に説明します。それには、人々が選択を行う(そのように使用し、追随する)ための一連の人々と、彼らが選択したときの彼らの理由が含まれます。
Glen_b-モニカの復活

回答:


9

これは、自由度と統計パラメーターについての話であり、なぜこの2つが直接単純な接続を持っているのが良いのかという話です。

歴史的に、ベータ関数のオイラーの研究では「」という用語が登場しました。彼は1763年までにそのパラメーター化を使用していました。エイドリアンマリールジャンドルも同様でした。この作業は、すべての既知の統計アプリケーションに先行しています。11

現代の数学的理論は、分析、数論、および幾何学における豊富な応用を通して、「」という用語が実際に何らかの意味を持っているという十分な兆候を提供します。これらの理由のいくつかを質問へのコメントでスケッチしました。11

さらに興味深いのは、「正しい」統計的パラメーター化がどうあるべきかということです。それはそれほど明確ではなく、数学的慣習と同じである必要はありません。一般的に使用される、よく知られた、相互に関連する確率分布のファミリーの巨大なウェブがあります。したがって、1つのファミリに名前を付ける(つまり、パラメータ化する)ために使用される規則は、通常、関連するファミリに名前を付けるための関連する規則を意味します。1つのパラメーター化を変更すると、それらすべてを変更する必要があります。したがって、これらの関係を手がかりとして見ることができます。

最も重要な流通家族が通常の家族に由来することに異議を唱える人はほとんどいません。の確率密度が比例する場合、確率変数は「正規分布」と呼ばれることを思い出してください。場合及び、有すると言われている標準的な正規分布。X X - μ / σ F X EXP - X 2 / 2 σ = 1 μ = 0 XX(Xμ)/σf(x)exp(x2/2)σ=1μ=0X

多くのデータセットは、データと低電力(通常は2乗)の合理的な組み合わせを含む比較的単純な統計を使用して研究されます。これらのデータが正規分布からのランダムサンプルとしてモデル化されている場合(各が正規変数実現と見なされるように、すべてのは共通の分布を共有し、独立している)、これらの統計の分布はその正規分布。実際に最も頻繁に発生するものはx 1 x 2x n x i X i X ix1,x2,,xnxiXiXi

  1. t ν T ν = N - 1 T = ˉ Xtνスチューデント分布tと "自由度"。これは統計の分布ですここではデータの平均をモデル化し、平均の標準誤差です。による除算は、が整数である場合、は以上でなければならないことを示していますν=n1SE X ˉ X =X1+

    t=X¯se(X)
    X 2 + + X N/ N SE X = 1 / X¯=(X1+X2++Xn)/nnX 2 1 + X 2 2 + + X 2 N/N - 1 - ˉ X 2 N-1つのNse(X)=(1/n)(X21+X22++X2n)/(n1)X¯2n1n 2 ν 12ν1以上。式は、明らかに少し複雑ですが、次数2のデータの有理関数の平方根です:比較的単純です。
  2. χ 2 ν χ 2χ2ν(カイ二乗)分布と "自由度"(DF)。これは、独立標準標準変数の平方和の分布です。これらの変数の二乗の平均値の分布は、従ってする分布によってスケーリング:私は「正規化」と、これに言及する分布。χ2 ν ν χ 2ννχ2 1 / ν χ 21/νχ2

  3. Fは、ν 1ν 2 F νFν1,ν2パラメータで比分布二つの独立した正規の比率であると分布と自由度。F 1ν 2(ν1,ν2)χ 2χ2 ν 1 ν 2ν1ν2

数学的計算により、これら3つの分布すべてに密度があることがわかります。重要なことに、分布の密度は、オイラーの関数()の積分定義の被積分関数に比例します。それらを比較しましょう:χ 2 ν Γχ2νΓ

F χ 2 ν2Xα X ν / 2 - 1つの E - XF Γ ν X α X ν - 1 E - X

fχ2ν(2x)xν/21ex;fΓ(ν)(x)xν1ex.

これは、2回の変数がパラメーターガンマ分布を持つことを示しています。半分の係数で十分ですが、を引くと関係がさらに悪化します。これはすでに質問に対する説得力のある答えを提供します:分布のパラメーターがそれを生成する2乗正規変数の数をカウントする場合(係数まで)、その密度の指数関数は、そのカウントの半分よりも1つ小さくなければなりません。 χ 2 νχ2ν ν / 2 1ν/21 χ 2 1 / 2χ21/2

なぜの要因であるの差よりも小さい厄介?その理由は、物事を合計するとき、要因は一貫したままであるからです。独立した標準法線の平方和がパラメーターガンマ分布に比例する(倍数倍)、個の独立した標準法線の平方和はパラメーターガンマ分布に比例します(倍数倍)。ここで、すべての変数の二乗和は、パラメーターガンマ分布に比例します(同じ時間の係数)。 1 / 2 1 N1/21n N M Mnmm、N + M 、M + Nn+mm+nパラメーターを追加すると、カウントの追加が非常に厳密にエミュレートされるため、非常に役立ちます。

ただし、その厄介な「」を数式から削除すると、これらの素晴らしい関係はより複雑になります。例えば、我々は、実際のパワーを参照するためにガンマ分布のパラメータを変更した場合ように、式分布は「ガンマに関係するであろうの電力ので、」分布(でそのPDFは)、3つの分布の合計は「ガンマ」分布と呼ばれる必要があります。要するに、自由度とガンマ分布のパラメーターの間の密接な加法的関係は、1 x1x χ 2 10 )、xは1 - 1 = 0 χ 2 12 - 1χ21(0)x11=0χ21(2)1計算式からになり、パラメーターに吸収されます。

同様に、比率分布の確率関数は、ベータ分布に密接に関連しています。実際、に比の分布がある場合、にはベータ分布があります。その密度関数はF Y 、F Z = ν 1 Y /ν 1 Y + ν 2ν 1 / 2 ν 2 / 2 FYFZ=ν1Y/(ν1Y+ν2)(ν1/2,ν2/2)

F ZZ α Z ν 1 / 2 - 11 - Zν 2 / 2 - 1

fZ(z)zν1/21(1z)ν2/21.

さらに、これらのアイデアを完全な円にして、 dfのスチューデント分布の平方には、パラメーター比分布があります。もう一度、従来のパラメーター化を維持することは、自由度に寄与する基礎となるカウントとの明確な関係を維持することが明らかですT ν FtνF1 ν (1,ν)

統計的な観点から、およびBeta分布の従来の数学的パラメーター化のバリエーションを使用するのが最も自然で簡単です。分布を "分布」およびBeta分布は、「Beta分布」と呼ばれるべきです。実際、すでにそれを行っています。これが、「ガンマ」と「ベータ」の代わりに「カイ二乗」と「比率」分布の名前を使い続ける理由です。とにかく、Γ Γ α Γ 2 α α β 2 α 2 β F - 1ΓΓ(α)Γ(2α)(α,β)(2α,2β)F1密度の数式に表示される用語。 これを行うと、密度のパラメーターとそれらが関連付けられているデータカウントとの直接的な接続が失われます。常に1つずつオフになります。


1
答えてくれてありがとう(すでに+ 1d)。ちょっとしたフォローアップの質問があります。何かが足りないかもしれませんが、-1パラメーター化を使用して二項式との直接的な関係を犠牲にしているのではないでしょうか。
ティム

どちらの「二項式との直接的な関係」を参照しているのかわかりません、ティム ベータとき例えば、分布は二項サンプルの共役前として使用され、明確なパラメータは、使用に正確に正しいものです:あなたが追加(ない)の成功との数に(ではなく)失敗の数。B A - 1 B B - 1(a,b)aa1bb1
whuber

1

表記は誤解を招きます。では、およびがより大きくなければならないため、式に「hidden」があります質問で指定した2番目のリンクはこれを明示的に示しています)。2つの式のとは同じパラメーターではありません。彼らは、異なる範囲を持っている:に、、及びに、。およびこれらの範囲- 1 1 1 α β - 1 α β 1 α β > - 1 2 α β > 0 α β 1 α = - 1 β = 0 0 1 2 α = 0 β = 11(1)(1)αβ1αβ(1)α,β>1(2)α,β>0αβ密度の積分が発散しないことを保証するために必要です。これを確認するには、で(またはそれ以下)およびの場合を検討し、から間の密度(のカーネル)の統合を試みます。同様に、(またはそれ以下)およびについてもで同じことを試してください。(1)α=1β=001(2)α=0β=1


2
ポッハマーが1890年に特定の輪郭積分として行ったように、積分が解釈されると、αβの定義範囲の問題はなくなるようです。その場合、αβのすべての値(すべての複雑な値を含む)の分析関数を決定する式と同一視できます。これは、問題の懸念に光を投げかけます。他の多くの可能なパラメーター化が等しくうまく機能すると思われる場合、なぜこの特定のパラメーター化が正確に採用されたのでしょうか?αβαβ
whuber

1
私にとって、OPの疑いははるかに基本的なようです。彼は(-1)については(2)で「-1」について混乱していますが、(1)ではそうではありません(もちろん正しくありません)。あなたのコメントは別の質問に答えているようです(ところで、もっと興味深い)。

2
あなたの努力と答えに感謝しますが、それでも私の主な懸念に答えていません:-1が選ばれた理由 ロジックに従って、基本的に任意の値を選択して、任意の下限を他の値に変更できます。0が「審美的に」良い境界であるという事実以外に、パラメーター値の下限が-1または0のほうが良い場合も悪い場合もありません。一方、Beta(0、0)は、最初のフォームを使用する場合の均一な分布の「デフォルト」になります。はい、それらは非常に主観的なコメントですが、それが私の主なポイントです:そのような選択の任意の非bit意的な理由はありますか?
ティム

1
禅、元の投稿をどのように解釈するかという質問があったことに同意します。ティム、説明をありがとう。
whuber

1
こんにちは、ティム!それは多くのための事実との接続を指示しますが、私は、任意の決定的な理由が表示されないα β > 0、もしU G A M M Aα 1 V G A M M Aβ 1 は独立しており、X = U /U + V B e t aα βα,β>0UGamma(α,1)VGamma(β,1)X=U/(U+V)、及び密度 Xは比例することにある X α - 11 - X β - 1。しかし、その後、ガンマ分布のパラメーター化を疑問視することができますBeta(α,β)Xxα1(1x)β1

0

私にとって、指数に-1が存在することは、ガンマ関数の開発に関連しています。ガンマ関数の動機は、階乗xのx!点を結ぶ滑らかな曲線を見つけることです!xx!を計算することはできないので直接場合、xはx整数でない、アイデアは、機能を見出すことであった任意のx 0x0を満たす、すなわち、要因によって規定される漸化

f 1 = 1F X + 1 = X F X f(1)=1f(x+1)=xf(x).

解決策は、積分の収束によるものでした。次のように定義された関数の場合

F X + 1 = 0 T X E - X D 、T f(x+1)=0txexdt,

部品による統合により、以下が提供されます。

f x + 1 = 0 T X E - X D T= [ - T X E - X ] 0 + 0 X T X - 1つの E - X D T= LIM X - T X E - X - 0 E - 0 + X 0 T X - 1つの E - X D T= 0 - 0 + X 0 T X - 1つの E - X D T= X F X f(x+1)=0txexdt=[txex]0+0xtx1exdt=limx(txex)0e0+x0tx1exdt=00+x0tx1exdt=xf(x).

したがって、上記の関数はこの特性を満たし、指数の-1は部品による統合の手順から派生します。ウィキペディアの記事https://en.wikipedia.org/wiki/Gamma_functionを参照してください

編集:投稿が完全に明確でない場合は謝罪します。私の考えでは、ベータ分布の-1の存在は、ガンマ関数による階乗の一般化に由来することを指摘しようとしています。2つの条件があり、F 1 = 1f(1)=1及びfはX + 1 = X F X f(x+1)=xf(x)。我々は持っているΓ X = X - 1 Γ(x)=(x1)!、したがって、Γ x + 1 =X Γ X = X X - 1 = x Γ(x+1)=xΓ(x)=x(x1)!=x!。さらに、 Γ 1 = 1 1 = 0 = 1Γ(1)=(11)!=0!=1。パラメーター α βをα,β持つベータ分布については、二項係数の一般化は Γ α + β Γ α Γ β =α+β-1α - 1 β - 1 Γ(α+β)Γ(α)Γ(β)=(α+β1)!(α1)!(β1)!。両方のパラメーターの分母に-1があります。


階乗によって満たされる反復関数はあなたが述べるものではないので、これは意味がありません:x + 1 X X (x+1)!xx!.
whuber

関数F X :漸化式を満たすガンマあるΓ X + 1 = X Γ X 。これが定義された方法です。f(x)Γ(x+1)=xΓ(x)
aatr

はい:しかし、あなたが述べた動機はガンマではなく階乗関数に基づいています。
whuber

ガンマと階乗の関係を思い出すことが重要です:Γ x = x 1 Γ(x)=(x1)!
aatr

残念なことに、それは循環論理です:階乗から始めて、ガンマを補間として特徴付け、それから-1が存在するという結論に達します。実際、あなたの投稿は、ガンマと階乗を混同することによって誤って抜け落ちたかのように-1を示します。それを照らしたり説得したりする人はほとんどいません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.