キャレットと係数(glmnet)


19

キャレットを使用して、特定のデータセットの推論を行うことに興味があります。以下を行うことは可能ですか?

  1. キャレットでトレーニングしたglmnetモデルの係数を生成します。glmにあるとは思わないので、固有の機能選択のためにglmnetを使用したいと思いますか?

  2. ROCメトリック以外に、モデルの適合を評価するために利用できる別のメトリックはありますか?調整済み?R2

この分析の目的は、予測ではなく、特定の変数の影響に関する推論を導き出すことです。キャレットパッケージは、これまでマトリックスを使用して簡単に操作できたため、気に入っています。


3
キャレットのパッケージには、ビネットのシリーズ(およびJSS紙)ご質問の中で最もそのカバーが付属しています。「特定の変数の影響に関する推論を導き出す」ことで、あなたが正確に何を意味するのかを示していただけますか?
CHL

係数による推論。Applied Predictive Modelingを読んで、Rとモデル構築について同時に学習しています。私はビネットとpdfを読みましたが、非常に多くの機能があるため、それらをすべて追跡するのは困難です。しかし、ザックは私の質問に答えたので、感謝しています。ありがとう!
user2300643

実際に私は、最終的なモデル係数抽出するための最良の答えを与えるために、私はここに与えるリンクを発見したstackoverflow.com/questions/48079660/...
Nusrat Rabbee

回答:


40

キャレットモデルを「モデル」と呼びます。最終的なglmnetモデルにアクセスするには、を使用しmodel$finalModelます。その後coef(model$finalModel)、などを呼び出すことができますcoef(model$finalModel, model$bestTune$.lambda)。のような係数が必要なlambdaの値を選択する必要があります。

関数のsummaryFunctionパラメーターを見てくださいtrainControl。予測子と応答を指定すると、最小化(または最大化、maximizeへの引数を参照train)する関数を指定できます。

この方法で調整されたR ^ 2を取得するのは難しいかもしれませんが、おそらくR ^ 2または同様のものを取得できます。


3
ありがとう、ザック。それはまさにそれでした。また、caretEnsembleパッケージに感謝します。良い仕事を続けてください。
user2300643

@ user2300643問題ありません!パッケージを使用していることを嬉しく思います。
ザック

6
ではcaret、バージョン6.0.78、最高のチューニングされたラムダは今です:model$bestTune$lambda
ハリソン

それらの係数の標準誤差を取得する方法はありますか?
saifulsafuan
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.