Rでより最近の観測により多くの重みを割り当てるにはどうすればよいですか?
私はこれをよくある質問または欲求と見なしますが、これを実装する方法を正確に理解するのに苦労します。私はこれについてたくさん検索しようとしましたが、良い実用的な例を見つけることができません。
私の例では、時間の経過とともに大きなデータセットができます。最近のデータ行にある種の指数重み付けを適用したいと言いたいです。したがって、2015年の観測は2012年の観測よりもモデルのトレーニングに重要であると言って、ある種の指数関数を持つことになります。
データセット変数にはカテゴリ値と数値の混合が含まれており、ターゲットは数値です-それが重要な場合。
GBRET / Random Forestなどのモデルを使用して、理想的にはCARETパッケージでテスト/試してみたいと思います。
更新質問
2つのポイント間の日付距離によって重みを指数関数的に減衰させる方法について、以下に示す応答に感謝します。
ただし、このモデルをキャレットでトレーニングする場合、重みはどの程度正確に考慮されますか?各トレーニング行の重み値は、将来のあるポイントとそのポイントが履歴的に発生したときの間の距離です。
重みは予測中にのみ機能しますか?なぜなら、それらがトレーニング中に出てきた場合、さまざまなクロスフォールドが異なる重みを持ち、実際にその前の時点であるかもしれない何かを予測しようとするため、あらゆる種類の問題を引き起こさないのではないでしょうか?