機械学習の問題を回帰フレームワークに変換する


12

私は説明変数のパネルがあるとため、、、ならびにバイナリ結果従属変数のベクトルを。したがって、は最終時間でのみ観測され、それ以前の時間では観測されません。完全に一般的なケースは、各ユニットに対して各時刻にに対して複数のを持たせることですが、簡潔にするためにケース注目しましょう。私は= 1 Xiti=1...Nt=1...TYiTYTXijtj=1...KitK=1

このような「アンバランス」ペアと時間相関の説明変数の適用例は、(毎日の株価、四半期ごとの配当)、(毎日の天気予報、毎年のハリケーン)または(各移動後のチェスポジションフィーチャ、勝ち/負け結果)です。ゲームの終わり)。(X,Y)

私は、回帰係数(おそらく非直線的)に興味があります行うための予測のトレーニングデータに、初期の観測与えられたことを知って、XをトンのためのT < T、それが最終的な結果につながるのY I TβtYitXitt<TYiT

Y^it=f(k=1tXikβk),t=1...T

計量経済学のバックグラウンドから来て、そのようなデータに適用される回帰モデリングはあまり見ていません。OTOH、私はそのようなデータに次の機械学習技術が適用されているのを見てきました。

  1. データセット全体で教師付き学習を行う、例えば最小化

i,t12(Yitf(Xitβt))2

観測されたYを過去のすべての時点に外挿/代入するだけでY

YitYiT,t=1...T1

これは、異なる時点間の一時的な相関関係を考慮しないため、「間違っている」と感じます。

  1. やって強化学習パラメータの学習で、このような一時的な差としてのおよび割引パラメータλを、再帰的解決のためにβ トンから始まる逆伝搬を通じてT = Tαλβtt=T

Δβt=α(Y^t+1Y^t)k=1tλtkβY^k

の勾配F に対するββY^f()β

これは、時間構造を考慮に入れているため、より「正しい」ように見えますが、パラメータλは一種の「アドホック」です。αλ

質問:上記の監視/強化学習手法を、古典統計/計量経済学で使用される回帰フレームワークにマッピングする方法に関する文献はありますか?特に、私は、パラメータを推定できるようにしたいと思い(すべてのためにすなわち、「一度」でT = 1 ... Tこのようなモデルに(非線形)最小二乗または最尤を行うことによって同時に)なのでβtt=1...T

YiT=f(t=1TXitβt)+ϵi

また、時差学習メタパラメータおよびλが最尤定式化から回復できるかどうかを知りたいと思います。αλ


3番目の段落で定式化を明確にしていただけますか?X i tt < Tからを予測したいが、次の式はY i tを予測したいことを示唆しています。YiTXitt<TYit
NRH

@NRHは実際にはのみを観察しますが、教師あり学習に関する文献で私が見たのは、観察されていないY i tY i Tと等しくなるように誘導し、フィッティングを行ってこの偽のYを実際に説明することですX i tからi t(これは、各位置の評価関数がゲームの最終結果に当てはまるゲームプレイアプリケーションで行われます)。これが私の最初の処方から明らかでない場合は申し訳ありません。いずれの場合Y I トンYiTYitYiTYitXitY^it観測されたイベント与えられると、(ゲームアプリケーションで)予測される「結果」になります。Xit
TemplateRex

私は設定とあなたが観察することを理解していますが、質問の定式化は不明確です。言葉で書くときにを予測するためのモデルをトレーニングしますか、それとも式が示すようにすべてのtに対してY i tを予測するためのモデルをトレーニングしますか?たぶんそれは単なるタイプミスです。あなたが書くとき"... 予測YをI T ..."あなたが意味するか"... 予測Y I T ..."?YiTYittYiTYit
NRH

これを行う理由は明らかではありません。実際の実用的なアプリケーションを説明できれば、より明確な答えが得られるかもしれません。一般に、各タイムスパンの最適な予測は、利用可能なデータX 1X tに対して回帰をtごとに個別に行うことです。同時アプローチに利点があることは明らかではありません。データセットの統計モデルを指定する必要があると思うので、そのメリットはより明確になります。YTX1,,Xt
seanv507

@NRHは、はい、私は予測したいからX トン、それが結果につながることを知っY I T Iはまた、観察場所をテストデータに最適な行動をとるためには、トレーニングデータにX I Tが、持っていない、まだ結果を観察しました。処方を更新します。YitXitYiTXit
TemplateRex

回答:


1

問題の説明は私には完全に明確ではないので、いくつかの仮定を推測しようとします。これで質問に答えられない場合は、少なくとも問題をさらに明確にするのに役立つかもしれません。

私にとって明らかでない最初の事柄は、あなたがあなたの予測の基礎にしたいデータです。あなたは予測したい場合はするまでの観測データに基づいて、T < Tこれはつまり、将来のデータを使用しますので、その後、あなたの方法2のように再帰的なアプローチは意味がありませんX ττ > トンYTt<TXττ>t

第二に、予測された特性が何であるかを述べない。一般に、時間t < Tで情報X 1X tが与えられると、条件付き期待値Y t = E [ Y TX 1X t ]はL2の意味でのY Tの「最良の予測子」です。条件付き期待値を本当に予測したい場合、通常の最小二乗法が実用的な推定の選択方法です。YtX1,,Xtt<TYt=E[YTX1,,Xt]YT

Furthermore, I do not understand your remark about the correlations not being reflected by the regression based on the X1,,Xt. This incorporates everything you know until t including the correlations between your observations.

So summing up and phrasing this as an answer: If you want to make an optimal prediction in the L2 sense, based only on data observed until t<T you can use least squares regression.


in the training data, I want to use the fact that a given Xit observation will statistically lead to outcome YiT in order to predict Y^it for test data where I don't observe YiT until afterwards. If e.g. you know that after 3 windy days it will likely rain on day 7, you want to use that information to tell people to bring umbrellas after the weekend after a few windy days before.
TemplateRex

0


α
γ controls the relative effort given to predictions depending on how far they are from the end of a sequence. Because these sequences are finite in length, you can set this to γ=1 , to put the same weight on all estimates.


This does not really answer the question: e.g. how can the α and γ parameters be set optimally in a maximum-likelihood framework?
TemplateRex

α controls the speed of convergence but should has no effect on the final model or the likelihood of that model. In practice, I set it by trial and error. You have to set γ as it controls the relative importance of short term versus long term predictions if the same parameters are used across short and long predictions. That will be application specific depending on what you want to do with the predictions.
nsweeney
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.