もう少し情報; 仮定
- 事前に、選択する変数の数、およびLARSプロシージャで複雑さのペナルティを設定していることがわかります
- 計算コストは問題ではありません(変数の総数は少なく、たとえば50です)。
- すべての変数(y、x)が連続的であること。
LARSモデル(つまり、LARSフィットで非ゼロ係数をもつ変数のOLSフィット)は、同じ数の係数を持つモデルと最も異なりますが、徹底的な検索(la regsubsets())によって見つかりますか?
編集:50の変数と250の観測値を使用して、標準のガウスから抽出された実際の係数を使用します。選択した変数の2つのセットの違いはわずかなので、これらの設定は明らかに良くありません。これは本当に、ほとんどの違いを得るにはどのタイプのデータ構成をシミュレートする必要があるのかという問題です。