分布何ですか、一様分布では?


17

4つの独立した均一に分布した変数あります 。の分布を計算したい。Iは、分布計算あるとしたがって)、およびは今、合計分布は(も独立)理由a,b,c,d[0,1](ad)2+4bcu2=4bc

f2(u2)=14lnu24
u2(0,4]u1=(ad)2
f1(u1)=1u1u1.
u1+u2u1,u2
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
y(0,4]。ここでは、でなければならないため、積分は等しくなりそれをMathematicaに挿入して、x>y
fu1+u2(x)=140x1xyxylny4dy.
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

私はそれぞれ個の数字で構成される4つの独立したセット作成し、ヒストグラムを描きました:a,b,c,d106(ad)2+4bc

ここに画像の説明を入力してください

そしてプロットを描きました:fu1+u2(x)

ここに画像の説明を入力してください

一般に、プロットはヒストグラムに似ていますが、間隔ほとんどが負です(ルートは2.27034です)。そして、正の部分の積分はです。(0,5)0.77

間違いはどこですか?それとも、どこで何かが欠けていますか?

編集: PDFを表示するためにヒストグラムをスケーリングしました。

ここに画像の説明を入力してください

編集2:私は推論のどこに問題があるのか​​を知っていると思う-統合の限界。そのためと、私はできません単にプロットショー私は統合する必要があり地域。:y(0,4]xy(0,1]0x

ここに画像の説明を入力してください

つまり、にはがあり(これが、一部が正しい理由です)、にがあり、 in。残念ながら、Mathematicaは後者の2つの積分の計算に失敗します(まあ、2番目の計算は、出力に虚数単位があり、すべてを損なうため... )。0xy(0,1]fx1xy(1,4]x14y(4,5]

編集3: Mathematicaは次のコードで最後の3つの積分を計算できるようです:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

これは正しい答えを与えます:)


2
私はあなたがシミュレーションによってあなたの答えの妥当性をチェックしようとしたことが好きです。あなたの問題は、あなた間違いを犯したことは知っているが、どこにあるのか見当がつかないことです。メソッドの各段階をチェックし、エラーのある場所をトラブルシューティングできると考えましたか?たとえば、エラーはますか?まあ、あなたはあなたの最終的な答えのためにやったのと同じようにシミュレートされた結果に対して計算されたPDFをチェックすることができます。についてもです。場合と両方とも正しいそれらを組み合わせたとき、あなたはエラーをしました。このような段階的なチェックにより、間違った箇所を正確に特定できます!f1(u1)f2f1f2
シルバーフィッシュ

私は最初の試みを捨てて、ゼロから再計算しました。私はとが正しいと信じていますが、ユニティに正規化するには、最初のを手動で2必要がありました。しかし、それは高さを変えるだけで、なぜ私が負のを持っているのか説明しません。f1f2f1f
corey979

そのようなヒストグラムを生成して計算された代数量と比較する場合、ヒストグラムを有効な密度にスケーリングします(可能な場合は重ね合わせます)。f1とf2に対して同様のチェックを行い、それらが正しいことを確認します。もし彼らが正しいなら(私はまだそれらを疑う正当な理由は見なかったが、再確認するのが最善だ)、問題は後であるに違いない。
Glen_b-モニカを

回答:


19

多くの場合、累積分布関数を使用すると役立ちます。

最初、

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

次、

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

ましょう最小の範囲()および最大(の)の可能な値。CDFを、PDFでを書くと、計算する必要がありますδ05(ad)2+4bcx=(ad)2Fy=4bcg=G

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

我々はできる期待し、これはnasty--する一様分布のPDFが不連続であるので、の定義にブレークを作るべきやや驚くべきである、-SO Mathematicaは(私はここでは再現しません)閉じた形式を取得します。に関して微分すると、目的の密度が得られます。3つの間隔内で区分的に定義されます。で、Hδ0<δ<1

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

で、1<δ<4

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

そして中、4<δ<5

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

図

この図は、の iid実現のヒストグラムにプロットをオーバーレイします。2つはほとんど区別がつかず、の式の正確さを示唆しています。h106(ad)2+4bch


以下は、ほとんど心のない、総当たりのMathematicaソリューションです。計算に関する事実上すべてを自動化します。たとえば、結果の変数の範囲も計算します。

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

ここにすべての統合と差別化があります。(辛抱してください;計算には数分かかります。)H

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

最後に、シミュレーションとのグラフとの比較:h

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

8
(+1)、特に密度畳み込みの代わりに、「累積分布関数を使用すると役立つことが多い」ことを人々に思い出させるために- 特に、次のような単純な形式の場合に。そして、あなたはまた素早いものでした。
アレコスパパドプロス

それは私が受け入れたいと思うきちんとした解決策のように見えます-私がそれを理解した直後。私は確率論者というよりは微積分学者です。この時点で、3つの質問があります。i)CDFを使用してとを取得した方法、ii)の積分の下にとがある理由、iii)その形式からどのようにソリューションの結果が区分的になることを?F(x)G(y)FgH
corey979

(1)および CDFです。それらは、最初の出現に続く最初の等式によって示されるように、CDFの定義から計算されます。詳細は、挿入したコードで明らかになります。(2)これは合計の畳み込み式です(stats.stackexchange.com/a/144237の同様の計算で詳細に説明されています)。(3)一様分布のプロパティに関する別のスレッドへのリンクを挿入しました。FG
whuber

7

OPやwhuberと同様に、独立性を使用して、これをより単純な問題に分割します。

ましょ。のpdfは、は次のようになります。X=(ad)2Xf(x)

ここに画像の説明を入力してください

してみましょう。のpdfは、は次のようになります。Y=4bcYg(y)

ここに画像の説明を入力してください

問題は pdfを見つけることになりました。これを行うには多くの方法がありますが、私にとって最も簡単なのは、現在の開発版mathStaticaから呼び出される関数を使用することです。残念ながら、現時点ではこれは公開リリースでは利用できませんが、入力は次のとおりです。X+YTransformSum

TransformSum[{f,g}, z]

の確率密度関数を区分関数として返します。Z=X+Y

ここに画像の説明を入力してください

、導出されたばかりのpdfのプロットを次に示します。h(z)

ここに画像の説明を入力してください

クイックモンテカルロチェック

次の図は、pdfの経験的モンテカルロ近似(波線の青)と上記で導出された理論上のpdf(赤の破線)を比較しています。よさそうだ。

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.