変換された変数の密度の直感的な説明?


37

仮定 PDFとランダム変数である。次に、確率変数の確率密度関数はXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

この背後にある計算を理解しています。しかし、私は微積分を知らない人にそれを説明する方法を考えています。特に、因子が前面に現れる理由を説明しようとしています。私はそれに刺します:1y

仮定ガウス分布を有します。pdfのほぼすべての重みは、値と間ですただし、 0〜9にマップされます。そのため、のpdfの重い重みは、への変換の値のより広い範囲にわたって拡張されています。したがって、が真のpdfであるためには、余剰重量を乗数因子だけ小さくする必要がありますX33.YXYfY(y)1y

それはどのように聞こえますか?

誰かが自分自身のより良い説明を提供したり、文書や教科書のいずれかへのリンクを提供できれば、とても感謝しています。この変数変換の例は、いくつかのイントロ数学的確率/統計の本にあります。しかし、私はそれで直感的な説明を見つけることはありません:(


あなたの説明は正しいと思います。
-highBandWidth

2
説明は正しいが、それは純粋に定性的なものである:乗法因子の正確な形はまだ謎である。-1/2の力は単に魔法のように見えます。したがって、あるレベルでは、Calculusと同じことを行う必要があります。平方根関数の変化率を見つけます。
whuber

回答:


37

PDFは高さですが、面積によって確率を表すために使用されます。 したがって、面積と高さのベースが等しいことを思い出させるような方法でPDFを表現するのに役立ちます。

最初に、任意の値での高さはPDFによって与えられます。基底は無限小セグメントであり、分布(つまり、分布関数ではなく確率測度)は実際には微分形式、つまり「確率要素」です。xfX(x)dx

PEX(x)=fX(x)dx.

PDFではなく、これは、確率を表現するために必要なすべての要素が明示的に含まれいるため、概念的にも実際的にも使用したいオブジェクトです。

xy=x2で再表現すると、ベースセグメントdxが引き伸ばされます(または圧縮されます):xからx+dxまでの区間の両端を2乗することにより、y領域のベースが長さの間隔である

dy=(x+dx)2x2=2xdx+(dx)2.

2つの無限小の積は、無限小と比較して無視できるため、結論付けます。

dy=2xdx, whence dx=dy2x=dy2y.

これを確立すると、新しい高さと新しい幅を差し込むだけなので、計算は簡単です。

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

yに関して基底はdy、乗算するものは何でも高さでなければならず、中間項から直接読み取ることができます。

12yfX(y)=fY(y).

この方程式PEX(x)=PEY(y) は、事実上面積の保存(=確率)法則です。

2つのPDF

このグラフィックは、y=x2によって関連付けられた2つのPDFの狭い部分(ほとんど無限小)を正確に示しています。確率は影付きの領域で表されます。間隔の圧搾に起因[0.32,0.45]を介して二乗は、赤色領域(高さy左側には、)比例青色領域(の面積と一致するように拡張されなければならないx右に)。


2
私は無限小が大好きです。これは素晴らしい説明です。変換の導関数から明らかになることがわかる観点から考えることは、√の観点から考えるよりもはるかに直感的です。2x。それが私のこだわりのポイントだったと思います。y
lowndrul

@whuberは、私はあなたを信じている最初の行がなければなりません?それはpdf Xx が意味するものですか?PS:私の答えに対するあなたの考えにも興味があります(下)。P(X(x,x+dx))=fx(x)dxpdfX(x)
カルロスチネリ

@Carlos最初にやった方法でアイデアを表現するのはもう少し厳密です:PDFは、与えられた確率測度を得るためにルベーグ測度を掛けたものです。dx
whuber

@whuberしかし、pdfがあなたが掛けるものである場合、それはあなたが書いたように積f xx d xではなく、項です?なぜ製品をf Xx d x a pdf と呼ぶのかは明確ではありません。fX(x)fx(x)dxfX(x)dx
カルロスチネリ

1
@カルロス:ありがとう。今、私はあなたの要点を見ます。私はそれに対処するためにいくつかの編集を行いました。
whuber

11

常に正方形のオブジェクトを製造し、正方形の辺の長さの分布を知っている場合はどうでしょうか。正方形の面積の分布について何が言えますか?

特に、確率変数分布がわかっている場合、Y = X 2について何が言え ますか?あなたが言うことができる一つのことはXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

したがって、 CDFとXの CDFの間に関係が確立されます。PDF間の関係は何ですか?そのためには微積分が必要です。両側の導関数を取得すると、必要な結果が得られます。YX


2
(+1)これは完全な答えではありませんが、を見つけるための良い方法を提示し、それが2つの部分の合計である理由を明確に示します。fY
whuber

1
pdf(x)= f(x)dxの理由がわかりません。pdf(x)dx = f(x)についてはdensity = prob mass/intervalどうですか?...何が間違っていますか?
フェルナンド

2

人口があり、Yがその人口の要約であるとします。次いで、P(Y(y,y+Δy))、可変有する個体の割合カウントさY範囲で(y,y+Δy)。あなたはサイズの「ビン」としてこれを考慮することができΔyと私たちは多くの人々がそのビンの内側にあるかを数えています。

次に、別の変数X観点からそれらの個体を再表現しましょう。我々は知っていることを考えるY及びXとして関連しているY=X2、イベントY(y,y+Δy)イベントと同じであるX2(x2,(x+Δx)2)そのイベントと同じであるX(|x|,|x|+Δx) or X(|x|Δx,|x|)。このように、binにある個人(y,y+Δy)もビンでなければなりません(|x|,|x|+Δx)(|x|Δx,|x|)。言い換えれば、それらのビンは同じ割合の個人を持たなければなりません。

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

さて、密度に行きましょう。まず、確率密度とは何かを定義する必要があります。名前が示すように、それは地域ごとの個人の割合です。つまり、そのビン上の個人のシェアをカウントし、ビンサイズで割ります。ここでは、人々の割合は同じであるが、ビンのサイズが変更されていることを確認したため、密度は異なると結論付けます。しかし、どれだけ違いますか?

我々が言ったように、確率密度は、従って、密度、ビンのサイズで割ったビン内の人の割合であるYで与えられるfY(y):=P(Y(y,y+Δy))Δy。同様に、確率密度Xで与えられるfX(x):=P(X(x,x+Δx))Δx

各ビンの人口が同じであるという以前の結果から、それが得られます。

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

つまり、密度fX(y)+fX(y)因子によって変化ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y、それが要因12yは変換に現れます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.