ロングホライズン予測可能性の神話

8

私は最近、将来の株式市場のリターンの予測についての興味深い記事に出くわしました。著者は以下のグラフを提示し、0.913のR ^ 2を引用しています。これは著者の方法を私がこれまでにこの主題で見たことよりはるかに優れたものにするでしょう（ほとんどが株式市場は予測不可能であると主張します）。

著者は彼の方法を非常に詳細に説明し、結果を裏付けるための実質的な理論を提供します。次に、このホワイトペーパーを参照する2番目の批評的な記事「ロングホライズン予測可能性の神話」を読みました。どうやら人々は何十年もの間この幻想に陥っています。残念ながら、私はその論文を本当に理解していません。

これは私に次の質問を導きます：

トレーニングとモデル検証の両方に同じデータセットを使用することにより、長期予測の誤った信頼が生じますか？トレーニングと検証のデータが別々の重複しない期間から取得された場合、問題は解消されますか？
トレーニングセットの検証とは別に、なぜこの問題は長い期間にわたってより顕著になるのですか？
一般的に、長期予測を行う必要があるモデルをトレーニングする場合、この問題をどのようにして克服できますか？

machine-learning time-series forecasting predictive-models

— ライアン・ゾッティ
ソース

1

CVでこのスレッドに出くわしたかどうかはわかりませんが、このトピックに関するいくつかの論文を参照しました。stats.stackexchange.com/questions/294489/...

— horaceT

4

簡単な答えは、時系列の元のスケールでR ^ 2を測定したくないということです。予測が最後に見られた時系列値のコピーである場合、R ^ 2は巨大になります。例：

これは偽のケースと呼ぶことができます。この予測は完全にでたらめですが、私は値0.96を取得しています。

R ^ 2は、たとえばyとy-hatの最初の差など、静止したタイムセルを使用して測定された場合、正直な値になります。

— アレクセイ・バーナコフ
ソース

1

$R^2$

$t$ $k$ $k$

$t$ $t-1$ $t-2$ $t-k$

$k$ $R^2$ $k = 40$ $R^2$

— クリスノバック
ソース