特定の著者が「分散の分散」によって何を意味するかを推測することしかできません。この概念が(直感的に)持つべき特性を検討することで、可能性を制限したいと思うかもしれません。 「分散が追加する」ことはわかっています。合計の分散は、Xとεの共分散がゼロの場合のXとεの分散の合計です。の「共有分散」を定義するのが自然であるXをの分散によって表される合計の分散の割合であることを合計でX。これは、任意の 2つの確率変数Xの共有分散を暗示するのに十分 です。バツ+ εバツεバツεバツバツバツそしてその相関係数の二乗でなければなりません。Y
この結果は、二乗相関係数の「共有分散」としての解釈に意味を与えます。適切な意味で、それは実際には合計の1つの変数に割り当てることができる合計分散の一部です。
詳細は以下の通りです。
原則とその意味
もちろん場合、それらの「共有分散」(これを「SV」と呼ぶことにしましょう)は100%になるはずです。しかし、YとXが単にスケーリングまたはシフトされたバージョンである場合はどうなりますか?たとえば、Yが都市の気温をF度で表し、Xが気温をC度で表す場合はどうでしょうか。このような場合でも、XとYの SVは100%であるべきで、XとYの測定方法に関係なく、この概念が意味を持ち続けることをお勧めします。Y= XYバツYバツバツYバツY
SV(α + βバツ、γ+ δY)= SV(X、Y)(1)
任意の数値およびゼロ以外の数値β 、δの場合。α 、γβ、δ
別の原理は、がXに依存しない確率変数である場合、X + εの分散を2つの非負の部分に一意に分解できることです。εバツバツ+ ε
Var(X+ ε )= Var(X)+ Var(ε )、
この特殊なケースでSVを次のように定義しようとすることを示唆しています。
SV(X、X+ ε )= Var(X)Var(X)+ Var(ϵ )。(2)
これらの基準はすべて2次までです(これらは、期待値と分散の形式で変数の1次モーメントと2次モーメントのみを含む)ので、とεが独立であり、それらが無相関であることだけを要求する要件を緩和しましょう。これにより、他の場合よりも分析がより一般的になります。バツε
結果
これらの原則(受け入れた場合)は、独特で親しみやすく解釈可能な概念につながります。 トリックは、一般的なケースを合計の特別なケースに減らすことであり、そこで定義適用できます。(2 )
与えられた、我々は単に分解しようとするとYをのスケール、シフトしたバージョンにXプラスと無相関である変数X(それが可能だ場合)であること、の検索を聞かせて定数:αとβとランダム変数εのためのどれ(X、Y)Yバツバツαβε
Y= α + βバツ+ ε(3)
。分解が一意になる可能性がある場合は、Cov(X、ε )= 0
E [ ε ] = 0
そう一度という発見され、αがによって決定されますβα
α = E [ Y] - βE [X] 。
これは線形回帰に非常によく似ており、実際にそうです。最初の原則では、とYを再スケーリングして単位分散を持たせることができ(それぞれにゼロ以外の分散があると仮定)、それが行われると、標準回帰の結果は(3 )のβの値がXとYの相関であることを表明します。バツYβ(3 )バツY
β= ρ (X、Y)。(4)
また、分散の撮影が得られます(1 )
1 = Var(Y)= β2Var(X)+ Var(ε )= β2+ Var(ε )、
含意
Var(ε )= 1 - β2= 1 - ρ2。(5)
したがって
SV(X、Y)= SV(X、α + βバツ+ ε )= SV(βバツ、βバツ+ ε )= Var(βバツ)Var(βバツ)+ Var(ϵ )= β2β2+ (1 - β2)= β2= ρ2(モデル3)(物件1)(定義2)(結果5)(関係4)。
Yρ (Y、X)= ρ (X、Y)バツY
SV(X、Y)= ρ (X、Y)2= ρ (Y、X)2= SV(Y、X)。