ベータ版の配布元はどこですか?


13

私は確信しているとして、誰もがここでは、すでにベータ分布のPDFを知っているで与えられますXB(a,b)

f(x)=1B(a,b)xa1(1x)b1

この式の起源を説明するために、あちこちで狩りをしてきましたが、見つけることができません。私がベータ版の分布で見つけたすべての記事は、この公式を提供し、その形状のいくつかを説明し、その後、その瞬間とそこから議論にまっすぐ進むようです。

私が導き出して説明できない数式を使うのは好きではありません。他の分布(例:ガンマまたは二項分布)については、学習して使用できる明確な導出があります。しかし、ベータ版ディストリビューションについては、そのようなものは見つかりません。

だから私の質問は次のとおりです。この式の起源は何ですか?最初に開発されたどのようなコンテキストでも、どのように第一原理から派生させることができますか?

[明確にするために、ベイジアン統計でベータ分布を使用する方法、または実際にそれが直感的に意味するものについては質問していません(野球の例を読みました)。PDFの導出方法を知りたいだけです。同様のことを尋ねる以前の質問がありましたが、問題に対処しなかった別の質問の重複としてマークされていたので(間違っていると思います)、ここでヘルプを見つけることができませんでした。

EDIT 2017-05-06:質問をありがとうございます。私が望むものについての良い説明は、私のコースインストラクターにこれを尋ねたときに得た答えの1つから来ると思います:

「人々はn個の合計をsqrt(n)で割った限界として通常の密度を導き出すことができると思います。また、一定の速度で発生するイベントの考えからポアソン密度を導き出すことができます。ベータ密度については、密度から独立して、論理的に何がベータ分布になるのかをある程度理解する必要があります。」

したがって、コメント内の「ab initio」のアイデアは、おそらく私が探しているものに最も近いでしょう。私は数学者ではありませんが、導出できる数学を使用するのが最も快適だと感じています。起源が私には扱えないほど進んでいるなら、そうであるが、そうでないなら、私はそれらを理解したいと思う。


5
何から派生した?二項共役優先アプローチが受け入れられない場合、いくつかの選択肢があります(たとえば、一様なランダム変数の順序統計、ガンマ変数の割合)。
GeoMatt22

3
注:Betaディストリビューションの全履歴は、このディストリビューションの信じられないほどのWikipediaページで提供されています。
西安

1
前の質問は、の重複としてマークされた他の OPは、彼らがコメントにした後、何であったかを明らかにした後。そこで、whuberは@ Geomatt22と同じ質問をしました。「派生とは、想定されるものから確立されるべきものへの論理的な接続を意味します何を想定しますか?」
回復モニカ- Scortchi

2
@Aksakalしかし、質問は広すぎる-それはあらゆる方法で導き出されるかもしれない。あなたが正しいなら、質問が可能な答えのグラブバッグ以外のものになるまで十分に絞り込まれるまで、私はそれをあまりにも広く閉じます
グレン_b -Reinstate Monica

3
少し歴史的なコンテキストの簡単な説明がここにあります(少なくとも不完全なベータ関数との関係に関して)。ガンマ分布との接続があり、他にも多くの多くの分布があり、さまざまな方法でかなり合理的に発生します。西安が指摘するように、ピアソンシステムに歴史的な起源があります。ここでどのような答えを探していますか?何が与えられた/何を導き出さなければならないのか?
Glen_b-モニカを

回答:


6

元物理学者として、私はそれがどのように導き出されたのかを見ることができます。これが物理学者の進め方です:

彼らは、次のような正の関数の有限積分、遭遇したときベータ機能 それらは本能的に密度を定義します: f s | x y = s x 11 s y 1

Bバツy=01tバツ11ty1dt
ここで0<s<1
fs|バツy=sバツ11sy101tバツ11ty1dt=sバツ11sy1Bバツy
0<s<1

彼らはこれを常にあらゆる種類の積分に対して非常に頻繁に行うので、考えさえすることなく反射的に起こります。彼らはこの手順を「正規化」または同様の名前と呼びます。定義により、密度は、常に正で、1になるなど、必要なすべてのプロパティを持っていることに注意してください。

上記の密度はベータ分布です。ft

更新

@whuberは、上記のロジックを無限の数の適切な積分に適用できる一方で、ベータ分布の特別な点を尋ねています(上記の回答で述べたように)。

特別な部分は二項分布に由来します。パラメータと変数の通常の表記法 ではなく、ベータ版と同様の表記法を使用してPDFを記述します

f(x,y|s)=(y+xx)sx(1s)y

ここで、成功と失敗の数、およびs-成功の確率。これがベータ分布の分子に非常に似ていることがわかります。実際、二項分布の事前分布を探すと、ベータ分布になります。ベータ版のドメインは0〜1であるので、それはまた、驚くことではありません、とあなたはベイズの定理に何をすべきかというのは:オーバー統合パラメータ下に示すように、この場合の成功の確率は 、:FX | X = f X | s f s x,yss ここでFS-ベータ分布の事前設定が与えられた成功確率の確率(密度)、およびF"X|-の密度確率sが与えられると、このデータセット(すなわち、観測された成功と失敗)。

f^バツ|バツ=fバツ|sfs01fバツ|sfsds
fsfバツ|ss

1
@ Xi'an OPは歴史に興味がないようです。
アクサカル

1
「この式の起源の説明...元々どのような文脈で開発されたか」は私には歴史のように聞こえます:-)。
whuber

3
歴史と第一原理の両方に同時に興味を持つことができると思います。:-)あなたの答えは数学的には正しいですが、残念ながらあまりにも一般的すぎます:有限積分で負でない関数の密度を作ることができます。それでは、この特定のディストリビューションファミリのどこが特別なのでしょうか?そのため、あなたのアプローチはどちらの観点も満たしていないようです。
whuber

2
@WillBradshaw、はい。通常、確率と試行回数をパラメーターとして、失敗(または成功)の数の関数として二項分布を調べます。このように、それは離散分布です。ただし、成功および失敗の数をパラメーターとして与えられた確率の関数としてそれを見ると、それを再スケーリングするとベータ分布になり、連続分布になります。
アクサカル

2
ベータ分布に関するWikipediaの記事は、西安@によって提案されたとおりに、カール・ピアソンにそれをトレースします。スティグラーは、彼の「統計の歴史:1900年以前の不確実性の測定」で、ピアソンの現代表記法を使った派生について簡単に説明しています。
whuber

15

ここに画像の説明を入力してください

BabWallis(1616-1703)、Newton(1642-1726)、およびStirling(1692-1770)が、積分の特別なケースをより早く処理することに言及しています。Karl Pearson(1895)は、この分布のファミリーを最初にPearson Type Iとしてカタログ化しました。


F(p,q)

ϱ=σ^12/σ^22pσ^12χp2qσ^12χq2
pϱq+pϱBp/2q/2
ωB(a,b)
ω/a(1ω)/bF(2a,2b)
B(a,b)F(p,q
fpqバツ{pバツ/q}p/211+pバツ/qp+q/2
y={pバツ/q}{1+pバツ/q}y01
バツ=qyp1y
dバツdy=qp1y+qyp1y2=pq1y2
gyyp/211yq/2+11y2=yp/211yq/2+1
[ここで、すべての正規化定数は、密度を1に統合することによって得られます。

2
+1。K.ピアソンは、ベータ分布を単に「カタログ化」したわけではないことに注意してください。二項分布の微分方程式と正規分布の微分方程式の間で観察した関係に触発された微分方程式の解を介して導き出しました。二項差分方程式を超幾何分布に一般化すると、微分方程式の一般化が生じ、その解には「タイプI」および「タイプII」ベータ分布が含まれました。これはまさに、OPが求めているab initio派生の一種です。
whuber

2
この答えを研究することで、多くを学ぶことができると思います。現時点ではあまりにも高度ですが、時間ができたら、戻ってあなたが言及したトピックを調査し、もう一度理解してみます。どうもありがとう。:)
ウィルブラッドショー

1

まず、頭の中の概念を数学的に正確に説明するのは得意ではありませんが、簡単な例を使用して最善を尽くします。

λ

λ=gバツ=λmaバツq|バツバツ0|1q q>0 0λλmaバツ
バツ0q=1/2

バツ0gバツPバツ0=Cgバツp1Pλdλ=Pバツ0dバツ0λ

Pλ=Pg1λ|dg1λdλ|=Cλp1λmaバツλq1

Cλmaバツ=1

言い換えると、ベータ分布は、ジッタ分布の中心での確率の分布として見ることができます。

この派生が、あなたのインストラクターの意図にある程度近づいたことを願っています。の機能形式に注意してくださいgバツ そして Pバツ0 は非常に柔軟で、三角形のような分布やU字型の分布(下の例を参照)から鋭く尖った分布に到達します。

参考までに、私はこれを博士研究の副作用として発見し、論文では、非膨張スパイク数分布(モードがゼロのバイモーダル)につながる非定常神経調整曲線のコンテキストで報告しました。上記の概念を適用すると、神経活動のベータポアソン混合分布が得られました。その分布はデータに適合させることができます。適合パラメータにより、両方の分布を推定できます。gバツ ジッター分布 pバツ0逆論理を適用します。ベータポアソン混合は、過剰分散をモデル化するために広く使用されている負の二項分布(ガンマポアソン混合)に代わる非常に興味深い柔軟な代替手段です。以下に、「ジッター」の例を示します ベータ版」-実行中のアイデア:

ベータポアソンスパイクモデルにつながるジッタモデル。

A:インセットのジッター分布から引き出されたシミュレートされた1Dトライアル変位(Pjttergバツp1)。試行平均化された発火フィールド(黒い実線)は、ジッターのない基本的なチューニングカーブ(青い実線、使用されたパラメーター)と比較して、より広く、ピークレートが低くなっています。λmaバツ=10p=.6q=.5B:結果の分布λバツ0N = 100回の試行とベータ分布の分析PDF C:パラメーター付きのポアソンプロセスからのシミュレートされたスパイク数分布λここで、iは、試行のインデックスと、上記のように導出された結果のベータポアソン分布を示します。D:ランダムなシフト角度を使用した2Dの類似状況で、同一の統計情報が得られます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.