との違いは何ですか?


18

一般的に、と違いは何ですか?E(X|Y)E(X|Y=y)

前者は関数であり、後者は関数ですか?とても混乱します。yx


うーん...後者はxの関数ではなく、数字であるべきです!私が間違っている?
デビッド

回答:


23

大雑把に言えば、との違いは、前者がランダム変数であるのに対し、後者は(ある意味では)。たとえば、 thenは確率変数 逆に、が観測されると、量興味を持つ可能性が高くなります。スカラーです。E(XY)E(XY=y)E(XY)

(X,Y)N(0,(1ρρ1))
E(XY)
E(XY)=ρY.
Y=yE(XY=y)=ρy

多分これは不必要な複雑さのように見えるかもしれませんが、をランダム変数と見なすことは、タワー法則ようなものを意味させるものです-中括弧内のものはランダムであるため、についてランダムなものはないのに対し、その期待値を尋ねることができます。ほとんどの場合、 E(XY)E(X)=E[E(XY)]E(XY=y)

E(XY=y)=xfXY(xy) dx

次に、結果の式で代わりにランダム変数を「プラグイン」することにより、取得します。前のコメントで示唆されたように、これらの事柄が厳密に定義され、適切な方法でリンクされることに関して、少し微妙な点が忍び寄ることがあります。これは、基礎となる理論に技術的な問題があるため、条件付き確率で発生する傾向があります。E(XY)Yy


8

仮定しと確率変数です。XY

してみましょう可能固定言う、実数。次に、 で :それは条件付期待値をとすれば値を有する。さて、いくつかのためのノートの固定実数、言う、 の条件付期待値になり 与えられた(実数)。およびと仮定する理由はありませんy0y 0 = 1 E [ X Y = y 0 ] = E [ X Y = 1 ] X Y 1 y 1 y 1 = 1.5 E [ X Y = y 1 ] = E [ X Y = 1.5 ] X Y = 1.5 E [ X Y =y0=1E[XY=y0]=E[XY=1]XY1y1y1=1.5E[XY=y1]=E[XY=1.5]XY=1.5E[XY=1.5]E[XY=1]同じ値を持ちます。したがって、は、 実数値を実数値マッピングする実数値関数と見なすこともできます。なお、OPの問題のステートメントことをの関数であり 間違っています:の実数値関数である。E[XY=y]g y y E [ X Y = y ] E [ X Y = y ] x E [ X Y = y ] y g(y)yE[XY=y]E[XY=y]xE[XY=y]y

一方、はランダム変数あり、偶然ランダム変数関数です。ここで、を記述するときは常に、ランダム変数 値がと、ランダム変数値は です。値がたびに、ランダム変数値はます。したがって、はランダム変数単なる別の名前ですE[XY]Z Y Z = h Y Y y Z h y Y y Z = E [ X Y ] E [ X Y = y ] = g y E [ X Y ] Z = g Y E [ X Y ZYZ=h(Y)YyZh(y)Yy Z=E[XY]E[XY=y]=g(y)E[XY]Z=g(Y)。ことを注意の関数である (ない OPの質問の文のように)。E[XY]Yy

簡単な説明例として、 とが共同分布の離散確率変数であるとします とは(依存)ベルヌーイ確率変数であり、それぞれパラメーターとあるため、 と ことに注意してください。今、注目すべき条件に、パラメータとベルヌーイ確率変数であるながらエアコンXY

P(X=0,Y=0)=0.1,  P(X=0,Y=1)=0.2,P(X=1,Y=0)=0.3,  P(X=1,Y=1)=0.4.
XY0.70.6E[X]=0.7E[Y]=0.6Y=0X0.75Y=1X20.70.6E[X]=0.7E[Y]=0.6Y=0X0.75上の、パラメータとベルヌーイ確率変数である。なぜこれがすぐに起こるのかわからない場合は、詳細を調べてください。たとえば、 およびおよびについても同様です。したがって、 したがって、ここで、はプロパティを楽しむ実数値関数です:Y=1X23
P(X=1Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,
P(X=1Y=1)P(X=0Y=1)
E[XY=0]=34,E[XY=1]=23.
E[XY=y]=g(y)g(y)
g(0)=34,g(1)=23.

一方、は確率がおよび である値およびを取るランダム変数です。それぞれ。は離散確率変数ですが、ベルヌーイ確率変数ではないことに注意してください。E[XY]=g(Y)34230.4=P(Y=0)0.6=P(Y=1)E[XY]

最後の仕上げとして、 すなわち、この期待値関数の我々は唯一の周辺分布使用して計算され、、持っているたまたま同じように数値を!これは、多くの人々がLIEであると信じているより一般的な結果の例です:

E[Z]=E[E[XY]]=E[g(Y)]=0.4×34+0.6×23=0.7=E[X].
YYE[X]
E[E[XY]]=E[X].

申し訳ありませんが、それはほんの小さな冗談です。LIEは反復期待値の法則の頭字語であり、誰もが真実だと信じている完全に有効な結果です。


3

E(X|Y)は、ランダム変数の期待値です:条件とするの期待値。 一方、は特定の値です:場合のの期待値。XYE(X|Y=y)XY=y

このように考えてください摂取カロリーを表し、が身長を表すとします。、その後、カロリー摂取である条件付きの高さに-と、この場合には、カロリー摂取量(で私たちの最高の推測を表す人が一定の高さがある)、たとえば、180センチメートル。 XYE(X|Y)E(X|Y=y)XY=y


4
あなたの最初の文は「配布」を「期待」に置き換えるべきだと思います(2回)。
Glen_b

4
E(XY)は、与えられたの分布ではありません。これは、条件付き密度または条件付き分布関数によってより一般的に示されます。の条件付き期待値であり、所与であり、 -measurableランダム変数。は、が観測されたときのランダム変数の実現と考えることができます(ただし、測定理論の微妙さが入り込む可能性があります)。XYfXY(xy)E(XY)XYYE(XY=y)E(XY)Y=y
男14年

1
@guyあなたの説明は、これまでに提供された最初の正確な答えです(これまでに提供された3つのうち)。回答として投稿することを検討しますか?
whuber

私はだろうが、私は確信してどのように精度を両立し、OPに対する答えが適切に有用なものではないと私は専門的にアップつまずい得ることについて妄想してる@whuber :)

@Guyあなたはすでに技術で良い仕事をしたと思います。あなたはOPとうまく通信することに敏感です(これは素晴らしいです!)、説明するための簡単な例を提供することを検討してください-おそらく、バイナリの周辺との共同分布です。
whuber

1

X Y E X | Y = y X Y yE(X|Y)期待されているの値の値の与えられた値期待されているの値の値が与えられであるXY E(X|Y=y)XYy

一般的には値の確率であるで与えられた値が、あなたは、より正確な取得し、言うことができる、値のすなわち確率すべての「与えられたsの番目の」の値。違いは、最初のケースでは「値」についてであり、2番目のケースでは特定の値を考慮することです。X Y P X = x | Y = y x X y YP(X|Y)XYP(X=x|Y=y)xXyY

下の図が参考になります。

ベイズの定理図フォームウィキペディア


この回答では確率について説明し、質問では期待について尋ねます。接続とは何ですか?
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.