私は最近、将来の株式市場のリターンの予測についての興味深い記事に出くわしました。著者は以下のグラフを提示し、0.913のR ^ 2を引用しています。これは著者の方法を私がこれまでにこの主題で見たことよりはるかに優れたものにするでしょう(ほとんどが株式市場は予測不可能であると主張します)。
著者は彼の方法を非常に詳細に説明し、結果を裏付けるための実質的な理論を提供します。次に、このホワイトペーパーを参照する2番目の批評的な記事「ロングホライズン予測可能性の神話」を読みました。どうやら人々は何十年もの間この幻想に陥っています。残念ながら、私はその論文を本当に理解していません。
これは私に次の質問を導きます:
- トレーニングとモデル検証の両方に同じデータセットを使用することにより、長期予測の誤った信頼が生じますか?トレーニングと検証のデータが別々の重複しない期間から取得された場合、問題は解消されますか?
- トレーニングセットの検証とは別に、なぜこの問題は長い期間にわたってより顕著になるのですか?
- 一般的に、長期予測を行う必要があるモデルをトレーニングする場合、この問題をどのようにして克服できますか?
1
CVでこのスレッドに出くわしたかどうかはわかりませんが、このトピックに関するいくつかの論文を参照しました。stats.stackexchange.com/questions/294489/...
—
horaceT