回帰モデルの交差検証におけるモデルの安定性


10

ロジスティック回帰の複数の交差検証フォールド、および各回帰係数の結果の複数の推定が与えられた場合、予測子(または予測子のセット)が安定しているか、または回帰係数に基づいて意味があるかどうかをどのように測定すべきか?これは線形回帰では異なりますか?


@BGreeneとても賢い。それを回答として投稿してみませんか?アンサンブル学習の文学に関連性があるかどうかも疑問に思っています。
Jack Tanner

「複数の交差検定」とは、倍の交差検定を回実行することを意味しますか?mk
boscovich 2013年

@andrea、私は「複数の交差検証フォールド」、つまりフォールドと言います。k
Jack Tanner

回答:


2

CVの各テストフォールドから得られる回帰係数を独立した観測値として扱い、Shrout&Fleissによって報告されたクラス内相関係数(ICC)を使用してそれらの信頼性/安定性を計算できます。


0

クロス検証では、データをトレーニングセットとテストセットの2つの部分に分割するとします。一回で、トレーニングセットのモデルを当てはめ、それを使用してテストセットの応答を予測します。これにより、単一の予測子ではなく、モデル全体のエラー率が得られます。

通常の線形回帰で使用されるF検定のようなものを使用して、予測子のp値を見つけることができるかどうかはわかりません。

それが目的の場合は、たとえば、後方選択または前方選択を使用して、モデルから予測子を削除してみることができます。

CVの代わりにブートストラップを使用して、各予測子の信頼区間を見つけ、それがどれだけ安定しているかを確認できます。

CVで使用するフォールドの数はいくつですか。これは、1回限りの交差検証です。

おそらく、あなたの目的が何であるかについての詳細は、この質問に答えるのに役立ちます。


これは1つにしておくと仮定します。各フォールドの各予測子には、たとえば、ベイジアン事後CIからの信頼区間、またはglm(..., family="binomial")Rのstd err があります。leave-one-out実行全体の各予測子の間隔はどうすればよいですか?
Jack Tanner
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.