影響関数は基本的に、統計を再計算することなく、統計の値に対する観測値を削除することの影響(または「影響」)を評価するために使用できる分析ツールです。また、漸近分散の推定値を作成するためにも使用できます。影響が等しい場合、漸近分散はI 2です。私。私2ん
私が影響関数を理解する方法は次のとおりです。で表される、ある種の理論的なCDFがあります。単純なOLSの場合、F私(y)= Pr (Y私< y私)
ここで、Φ(zは)標準正規累積分布関数であり、σ2は誤差の分散です。これで、統計がこのCDFの関数になることを示すことができるため、S(F)という表記(つまり、Fの関数)になります。今、私たちは、機能変更と仮定Fをする、 "少し"でF(I)(Z)=(1+ζ)F(Z)-ζδ(I)(
Pr (Y私< y私)= Pr (α + βバツ私+ ϵ私< y私)= Φ (y私− (α + βバツ私)σ)
Φ (z)σ2S(F)FFここで、
δ I(Z )= I (Y I < Z )、および
ζ = 1F(私)(z)= (1 + ζ)F(z)- ζδ(私)(z)δ私(z)= 私(y私< z)。したがって、
F(i)は、「i番目」のデータポイントが削除されたデータのCDFを表します。私たちは、のテイラー級数行うことができます
F(I)(Z)について
ζ=0を。これは与える:
ζ= 1n − 1F(私)F(私)(z)ζ= 0
S[ F(私)(z、ζ)] ≈ S[ F(私)(z、0 )] + ζ[ ∂S[ F(私)(z、ζ)]∂ζ|ζ= 0]
なお、我々が得るように:
S [ F (I )(Z 、ζ )] ≈ S [ F (Z )] + ζ [ ∂ S [ F (I )(z 、ζ )]F(私)(z、0 )= F(z)
S[ F(私)(z、ζ)] ≈ S[ F(z)] + ζ[ ∂S[ F(私)(z、ζ)]∂ζ|ζ= 0]
ここでの偏微分は影響関数と呼ばれます。したがって、これは、「i番目」の観測を削除したために統計に対して行われる「一次」近似の補正を表します。回帰では、残りは漸近的にゼロにならないので、これは実際に得られる可能性のある変更の近似値であることに注意してください。を次のように記述します。β
β= 1んΣんj = 1(yj− y¯¯¯)(xj− x¯¯¯)1んΣんj = 1(xj− x¯¯¯)2
したがって、ベータは2つの統計の関数です。Xの分散とXとYの間の共分散です。これらの2つの統計は、CDFに関して次のように表されます。
c o v (X、Y)= ∫(X- μバツ(F))(Y- μy(F))dF
v a r (X)= ∫(X- μバツ(F))2dF
μバツ= ∫x dF
F→ F(私)= (1 + ζ)F- ζδ(私)
μx (私)= ∫x d[ (1 + ζ)F- ζδ(私)] = μバツ- ζ(x私- μバツ)
Va r (X)(私)= ∫(X- μx (私))2dF(私)= ∫(X- μバツ+ ζ(x私- μバツ))2d[ (1 + ζ)F- ζδ(私)]
ζ2
Va r (X)(私)≈ Va r (X)- ζ[(x私- μバツ)2− Va r (X)]
Co v (X、Y)(私)≈ Co v (X、Y)- ζ[(x私- μバツ)(y私- μy)− Co v (X、Y)]
β(私)ζ
β(私)(ζ)≈ Co v (X、Y)- ζ[(x私- μバツ)(y私- μy)− Co v (X、Y)]Va r (X)- ζ[(x私- μバツ)2− Va r (X)]
これで、テイラーシリーズを使用できます。
β(私)(ζ)≈ β(私)(0 )+ ζ[ ∂β(私)(ζ)∂ζ]ζ= 0
これを単純化すると、次のようになります。
β(私)(ζ)≈ β- ζ[(x私- μバツ)(y私- μy)Va r (X)- β(x私- μバツ)2Va r (X)]
μyμバツv a r (X)ζ= 1n − 1
β(私)≈ β− x私− x¯¯¯n − 1[ y私− y¯¯¯1んΣんj = 1(xj− x¯¯¯)2- βバツ私− x¯¯¯1んΣんj = 1(xj− x¯¯¯)2]
バツ〜= x − x¯¯¯sバツ
β(私)≈ β− x私〜n − 1[ y私〜sysバツ− x私〜β]