線形回帰で幾何学的重みを使用する理由


8

実際の応用において、私はしばしば以下の実践を目撃しました。時間の経過ペアを観察し ます。それらが線形に関連しているという仮定の下で、均一な重みではなく幾何学的な重みを使用して、一方を他方に対して回帰します。つまり、OLSは はいくつかの。これは非常に直感的です。これまでの観測の重み付けは少なくなっています。「ボックスカー」重み付けスキームと比較すると、観測値が観測ウィンドウから突然落ちることがないため、時間の経過とともに滑らかに変化する推定値を生成できるという利点もあります。ただし、との関係の根底にある確率モデルはあるのうか。(xt,yt)

t=0kt(yTtaxTtb)2
k(0,1)xtytこの選択を正当化する。

先日、関連するStackExchangeサイトのどこかで誰かがこのスキームについて「貧乏人のカルマンフィルター」とコメントしていました。リンクを見つけ出した場合は、ここに追加します。
Dirk Eddelbuettel、

ありがとう。これをカルマンフィルターとしてリフレームできる方法を知りたいのですが。
ギャップのある

1
正式な派生があるとは思えないため、貧しい人のバージョンの適応パラメータを引用しています。
Dirk Eddelbuettel、

回答:


6

「線形関連」とは通常、

yt=axt+b+εt

定数、およびiidのランダムエラー、。1が指数関数的に重み付けされたOLS推定値になるだろう一つの理由は、という疑いありと自身があまりにも、時間とともに変化する(ゆっくり)かもしれません。したがって、正しいモデルはabεtt=0,1,,Tab

yt=α(t)xt+β(t)+εt

未知の関数である とは、時間とともにゆっくりと変化し(あるとしても)、現在の値を推定することに興味がありますとです。これらの関数が滑らかであると仮定して、テイラーの定理を適用できるようにします。これは、α(t)β(t)a=αTb=βT

α(t)=α(T)+α(tα,t)(tT)

一部の場合、同様に。我々は考えると、最新の値であるとしてとそれぞれを、。これを使用して残差を再表現します。tα,t,0tα,t<Tβ(t)abαTβT

yt(axt+b)=α(tα,t)(tT)xt+β(tβ,t)(tT)+εt.

今、多くの手を振る必要があります。右側全体がランダムであると見なします。その分散は、に、の分散を加えたものにを分散に掛けたものです。。これらの2つの分散は完全に不明ですが、(アブラカダブラ)は、体系的(ランダムではないが、まだ不明)な「エラー」または「変化」が1回から累積される何らかの(確率的)プロセスの結果として発生したと考えてみましょう他の。これは指数関数を示唆しますεtxt2(tT)2α(tα,t)(tT)2β(tβ,t)これらの分散の経時変化。次に、右側の明示的な(ただし基本的には役に立たない)式を単純化し、二次項を指数関数に吸収します(とにかく乱暴に手を振っているので)。(tT)2

yt(axt+b)=δt

ある定数の場合、の分散はと等しくなります。間の可能な時間的相関を無視し、それらが正規分布であると仮定すると、データに比例する対数尤度を与えますδtexp(κ(tT))κδt

t=0Tkt(yTtaxTtb)2

(プラスにのみ依存無関係定数)と。したがっての値を知っている仮定すると、指数的に重み付けされたOLSプロシージャは、尤度を最大化します(プロファイル尤度プロシージャのようなもの)。kk=expκk

この全体的な導出は明らかに空想的ですが、指数重み付けは、時間の経過に伴う線形パラメーターの起こり得る変化に対処しようとする方法と、おおよその程度を示しています。これは、パラメーターをこれらのパラメーターの時間変化率に関連付けます。k


手を振る部分については同意します...明確に述べられている限り、回帰パラメーターの時変形式に関する仮定を単純化することに問題はありません。もちろん、既存の文献を自由に参照してください。
ギャップのある

@whuber-指数的に重み付けされた回帰は、あなたが説明した特定のモデルにとって非常に大雑把な近似であると私は言うでしょう。しかし、それは別のモデルに対する正確な解決策になる可能性があります。あなたが説明するモデルでは、変動による異分散成分を含める方がはるかに優れています(または、変動がないと仮定し、ランダム切片を処理していると仮定します)。幾何学的な重み付けは常に最適ではないように見えますが、そうではありません。それはあなたの以前の情報に依存します。α(t)
確率

@prob同意しますが、このアプローチを正確に正当化するモデルを見つけることができなかったので、そのようなモデルが必要とする可能性があることを指摘するために解決する必要がありました。お返事がこの方向に進んでいないことにも気づきました;-)。
whuber

@whuber-正確ではないために、方程式のどこで近似を行うのですか?
確率

@確率あなたは正当な理由を提供しない:あなたは単に私がすでに投稿した結果を発表するだけです。言い換えると、OLSがそのような式を最小化すると、重み付き最小二乗が実際に行われることがわかります。わかりましたが、それは完全に明白ではありませんか?この重みの選択を正当化するものは何ですか?彼らはどこから来たのか?
whuber

1

私はあなたが実際にあなたの体重としてを意味するか、またはだと思います。で、重みとしてを取る場合、です。したがって、これは現在の観測に最も重み付けしていません。たとえば、、など。ktk>10<k<1ktk=k=0.5k0=1,k1=2,k2=4,,k20106

これは、観測ごとに分散がどのように変化するかについて知っていることを述べているだけです(時刻から時間を遡ると、分散は大きくなります)。T

(yTt|xTt,a,b,k,s)Normal(axTt+b,s2kt)

示すとには、次のような対数尤度があります。Y{yT,yT1,,y1}X{xT,xT1,,x1}

log[p(Y|X,a,b,k,s)]=12(Tlog(2πs2kt)+t=0T1(yTtaxTtb)2s2kt)

したがって、と最尤推定値を取得するには、次の目的関数を使用します。ab

t=0T1kt(yTtaxTtb)2

あなたが探しているのはどれですか

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.