影響関数とOLS


15

影響関数の働きを理解しようとしています。誰かが簡単なOLS回帰の文脈で説明できますか

yi=α+βxi+εi

私はしたい場所影響関数を用。β


2
まだ具体的な質問はありません。影響関数の計算方法を確認しますか?特定の経験的な例が必要ですか?それが何を意味するかのヒューリスティックな説明?
whuber

1
フランク・クリッチリーの1986年の論文「主成分の影響機能」を調べると(論文の正確な名前を思い出せません)。彼はここで通常の回帰の影響関数を定義します(これは私の答えが間違っていることを証明する場合としない場合があります)。
確率論的

回答:


15

影響関数は基本的に、統計を再計算することなく、統計の値に対する観測値を削除することの影響(または「影響」)を評価するために使用できる分析ツールです。また、漸近分散の推定値を作成するためにも使用できます。影響が等しい場合、漸近分散はI 2です。II2n

私が影響関数を理解する方法は次のとおりです。で表される、ある種の理論的なCDFがあります。単純なOLSの場合、Fi(y)=Pr(Yi<yi)

ここで、Φzは標準正規累積分布関数であり、σ2は誤差の分散です。これで、統計がこのCDFの関数になることを示すことができるため、SFという表記(つまり、Fの関数)になります。今、私たちは、機能変更と仮定Fをする、 "少し"でFIZ=1+ζFZ-ζδI

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
Φ(z)σ2S(F)FFここで、 δ IZ = I Y I < Z 、および ζ = 1F(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z)。したがって、Fiは、「i番目」のデータポイントが削除されたデータのCDFを表します。私たちは、のテイラー級数行うことができますFIZについてζ=0を。これは与える:ζ=1n1F(i)F(i)(z)ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

なお、我々が得るように: S [ F I Z ζ ] S [ F Z ] + ζ [ S [ F I z ζ ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

ここでの偏微分は影響関数と呼ばれます。したがって、これは、「i番目」の観測を削除したために統計に対して行われる「一次」近似の補正を表します。回帰では、残りは漸近的にゼロにならないので、これは実際に得られる可能性のある変更の近似値であることに注意してください。を次のように記述します。β

β=1nj=1n(yjy¯)(xjx¯)1nj=1n(xjx¯)2

したがって、ベータは2つの統計の関数です。Xの分散とXとYの間の共分散です。これらの2つの統計は、CDFに関して次のように表されます。

cov(X,Y)=(Xμx(F))(Yμy(F))dF
var(X)=(Xμx(F))2dF
μx=xdF

FF(i)=(1+ζ)Fζδ(i)

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx)
Var(X)(i)=(Xμx(i))2dF(i)=(Xμx+ζ(xiμx))2d[(1+ζ)Fζδ(i)]

ζ2

VarバツVarバツζ[バツμバツ2Varバツ]
CovバツYCovバツYζ[バツμバツyμyCovバツY]

βζ

βζCovバツYζ[バツμバツyμyCovバツY]Varバツζ[バツμバツ2Varバツ]

これで、テイラーシリーズを使用できます。

βζβ0+ζ[βζζ]ζ=0

これを単純化すると、次のようになります。

βζβζ[バツμバツyμyVarバツβバツμバツ2Varバツ]

μyμバツvarバツζ=11

ββバツバツ¯1[yy¯1Σj=1バツjバツ¯2βバツバツ¯1Σj=1バツjバツ¯2]

バツ=バツバツ¯sバツ

ββバツ1[ysysバツバツβ]

それで、話は追加のデータポイントの影響についてですか?私は時系列データのインパルス応答により慣れています。統計的な文脈では、すべての影響は、標準化された回帰からの限界効果または(より良い選択)ベータ係数によって記述されます。さて、質問と答えを判断するために本当により多くのコンテキストが必要ですが、これは素晴らしいと思います(+1はまだですが、待っています)。
Dmitrij Celov 2011年

@dmitrij-それはリンクから暗示された(または私が推測した)ものです-これは統計の堅牢性プロパティに関するものです。影響関数は、1データポイントよりも少し一般的です。デルタ関数を再定義して、それらを合計することができます(非常に多くの観測)。モデルを再フィッティングする必要がないので、私はそれをある程度「安いジャックナイフ」と考えます。
確率

10

これは、回帰の影響関数について話す非常に一般的な方法です。まず、影響関数を表示する1つの方法に取り組みます。

FΣFεバツ

Fεバツ=1εF+εδバツ
δバツΣ{バツ}Σ

これから、影響関数をかなり簡単に定義できます。

θ^FψバツΓ

ψθ^Fバツ=リムε0θ^Fεバツθ^Fε

θ^Fδバツ

OLS推定は問題の解決策です。

θ^=argθE[YバツθTYバツθ]

バツy

θ^ε=argθ1εE[YバツθTYバツθ]+εyバツθTyバツθ

一次条件をとる:

{1εE[バツTバツ]+εバツTバツ}θ^ε=1εE[バツTY]+εバツTy

インフルエンス関数はちょうどガトー導関数であるため、次のように言うことができます。

E[バツTバツ]+バツTバツθ^ε+E[バツTバツ]ψθバツy=E[バツTY]+バツTy

ε=0θ^ε=θ^=E[バツTバツ]1E[バツTY]

ψθバツy=E[バツTバツ]1バツTyバツθ

この影響関数の対応する有限サンプルは次のとおりです。

ψθバツy=1NΣバツTバツ1バツTyバツθ

一般に、このフレームワーク(インフルエンス関数をGateaux誘導体として使用する)の方が扱いやすいと思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.