通常のマージンと指定された(ピアソン)相関による条件付き期待値の制限


8

別のフォーラムで次の質問を見ました。

「成人男性の身長と体重の両方が通常のモデルで説明でき、これらの変数間の相関が0.65であると仮定します。男性の身長が彼を60パーセンタイルに配置する場合、彼の体重はどのパーセンタイルであると予想しますか?」

問題のフォーラムの誰かが、質問はマージンが正常(height and weight ... can be described with normal models)であり、2変量の正常性について話しており、質問に単一の答えがないことをすでに指摘していることを私は知っています。

明らかに、答えは実際の2変量依存関係(コピュラ)に依存します。

私の質問は:

通常のマージンと指定された母集団相関(ρ、ピアソン相関)が与えられた場合、X Yの両方が正規であり、相関ρがある場合、境界を見つけるのに適度に簡単な方法はありますか?E(Y|X=xq)X,Yρ

条件付き期待値の正確な最大値と最小値がある場合、それ(および優先的には、それぞれが発生する状況*)を知っておくとよいでしょう。

*私はそれらの状況がどうなるかについて強い疑いを抱いています(つまり、関与する可能性のある依存の種類。特に、特定の種類の縮退分布が範囲を与えることを期待します)。深さ。(私は誰かがすでにそれを知っている可能性が高いと思います。)

それができない場合、最大値と最小値の両方の上限または下限が興味深いでしょう。

代数的な答えはいいでしょうが、私は代数的な答えを必ずしも必要としません(いくつかのアルゴリズムはそうするでしょう)。

概算または部分的な回答が役立つ/役立つ場合があります。

誰も良い答えを持っていない場合、私はそれを自分で試してみるかもしれません。

回答:


4

限界はないと思います。 この結論は、任意の連続分布について説明するのが最も簡単な次の構成に依存しています。進むにつれて、通常の限界の場合になるまで条件が追加されます。

したがって、を分布関数Fをもつ連続確率変数とする。ハーフオープン間隔a b (最終的には非常に狭くなる)を指定して、XF(a,b]

ψ:(a,b](,c]

経由して

ψ(x)=F1(F(x)F(a)).

これは単調増加し、明らかにされている。構造上、c=ψ(b)=F1(F(b)F(a))

Pr(X(a,b])=Pr(ψ(X)c).

を1対1のマップに拡張するΨ RR viaψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

それ以外の場合はです。分布Ψ Xはである同一のものとXが、何が行われたことは2つの間隔の間の値を交換することであるB ]および- C ]をΨ(x)=xΨ(X)X(a,b](,c]

図1:Psiのグラフ

ためのB ] = 1.5 1.75 ]Ψ(a,b]=(1.5,1.75]

ピアソン相関してみましょうとすることが ρ - 1 1 。(一般性を失うことなく、 X Yの両方が標準化されていると考えることができます。これにより、 ρ Xの連続性も変化しないためです)みましょうのx qはの条件付き期待質問のように、任意の実数で Yが評価されます。選択Bをれる X QABを]が、それはように絞り込む作るのPr Xを(X,Y)ρ(1,1)XYρXxqY(a,b]xq(a,b]から次に変化。小さなで ρ = EX 、Y ρ ' = EΨ X Yが任意に小さくすることができます。(それは、これを示すには少し手間がかかります、それはの条件付き期待という事実に降りてくる Yが与えられた X Cの増加は比較的ゆっくりとして | B - APr(X(a,b])ρ=E(XY)ρ=E(Ψ(X)Y)YXc減少します。そうでない場合、 ρは定義されません。)ただし、 Ψを適用すると、 EY | X = x q|ba|ρΨE(Y|X=xq)

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

これは、c以下のXの値での条件付き期待値です。YXc

図2:(Psi(X)、Y)のPDFのグラフ

PDFの輪郭。ここで。元の二変量正規分布は相関与えられた0.85にほぼ減少、0.5 2つのストリップ内の確率が交換された- --the目標値。(a,b]=(1.5,1.75]0.850.5

場合二変量正規分布であり、C - として| b a |(X,Y)c。提供 ρ 0、の条件付き期待値 Yはへ押し出される - ため ρ > 0とに + のために ρ < 0。間隔a b [ c |ba|0ρ0Yρ>0+ρ<0(a,b] Yの条件付き期待値を他の方向に無限にプッシュします。元の値に調整することにより ρを少し我々は中に微小変化を補償する ρことを示し、起こりの元の値どのように関係なく、 ρはかもしれが、我々は条件付期待値については何も言うことはできません Yを任意の特定の時点で、 X = x q[c,)YρρρYX=xq

(見かけ上の例外は、たとえば、サポートが線y = ± xに限定されている正規限界を伴う2変量分布で開始することによって処理できます。)ρ=0y=±x


+1これは非常に興味深いです。これは、質問を書くときに念頭に置いていた構造に多少関係していますが、分位点のすぐ近くで条件付きのものだけを移動し、私が面白がっていたよりも思慮深い議論をすることを目標としています。あなたの結論は、最初は正しいと思われます。ありがとうございました。
Glen_b-2015

ここでは+1は実際には不十分です。
Glen_b-2015

0

私があなたの質問を正しく理解している場合、その答えは、使用されている「実際の2変量依存関係(コピュラ)」に依存します。

コピュラが正しく取ることができる値には限界がありますか?それでは、制限を確立するために、単調コピュラと単調コピュラを使用しないでください。

ここに画像の説明を入力してください

出典:Thorsten Schmidt-コピュラへの対応


ρ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.