高度に相関している多くの従属変数(DV)(〜450)を予測するための縮小モデルを作成しようとしています。
私の独立変数(IV)も非常に多く(〜2000)、非常に相関しています。
なげなわを使用して各出力の縮小モデルを個別に選択した場合、各従属変数をループするときに、独立変数の同じサブセットを取得することが保証されません。
Rの投げ縄を使用する多変量線形回帰はありますか?
これはグループなげなわではありません。グループラッソはIVをグループ化します。lassoも実装する多変量線形回帰(DVがスカラーのベクトルではなく行列であることを意味します)が必要です。(注:NRHが指摘するように、これは真実ではありません。グループラッソは、IVをグループ化する戦略を含むが、DVなどの他のパラメーターをグループ化する戦略も含む一般的な用語です)
スパースオーバーラップセットラッソと呼ばれるものに入るこのペーパーを見つけました
多変量線形回帰を行うコードは次のとおりです
> dim(target)
[1] 6060 441
> dim(dictionary)
[1] 6060 2030
> fit = lm(target~dictionary)
これは、単一のDVで投げ縄を行ういくつかのコードです
> fit = glmnet(dictionary, target[,1])
そして、これは私がやりたいことです:
> fit = glmnet(dictionary, target)
Error in weighted.mean.default(y, weights) :
'x' and 'w' must have the same length
一度にすべてのターゲットに適合する機能を選択する
glmnet
、完全なビネットが含まれています。