ロングホライズン予測可能性の神話


8

私は最近、将来の株式市場のリターンの予測についての興味深い記事に出くわしました。著者は以下のグラフを提示し、0.913のR ^ 2を引用しています。これは著者の方法を私がこれまでにこの主題で見たことよりはるかに優れたものにするでしょう(ほとんどが株式市場は予測不可能であると主張します)。

ここに画像の説明を入力してください

著者は彼の方法を非常に詳細に説明し、結果を裏付けるための実質的な理論を提供します。次に、このホワイトペーパーを参照する2番目の批評的な記事「ロングホライズン予測可能性の神話」を読みました。どうやら人々は何十年もの間この幻想に陥っています。残念ながら、私はその論文を本当に理解していません。

これは私に次の質問を導きます:

  • トレーニングとモデル検証の両方に同じデータセットを使用することにより、長期予測の誤った信頼が生じますか?トレーニングと検証のデータが別々の重複しない期間から取得された場合、問題は解消されますか?
  • トレーニングセットの検証とは別に、なぜこの問題は長い期間にわたってより顕著になるのですか?
  • 一般的に、長期予測を行う必要があるモデルをトレーニングする場合、この問題をどのようにして克服できますか?

1
CVでこのスレッドに出くわしたかどうかはわかりませんが、このトピックに関するいくつかの論文を参照しました。stats.stackexchange.com/questions/294489/...
horaceT

回答:


4

簡単な答えは、時系列の元のスケールでR ^ 2を測定したくないということです。予測が最後に見られた時系列値のコピーである場合、R ^ 2は巨大になります。例:

ここに画像の説明を入力してください

これは偽のケースと呼ぶことができます。この予測は完全にでたらめですが、私は値0.96を取得しています。

R ^ 2は、たとえばyとy-hatの最初の差など、静止したタイムセルを使用して測定された場合、正直な値になります。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.