ジャックナイフvs. LOOCV


回答:


11

交差検定では、除外されたサンプルの統計を計算します。ほとんどの場合、保持されたサンプルに基づいて構築されたモデルによって、除外されたサンプルを予測します。ジャックナイフでは、保持されたサンプルのみから統計を計算します。


4
この回答が元の質問のLOOCVにどのように影響するかはわかりません。ある意味で、1つの除外された観測で「統計を計算」できますか?
アレクシス

12

ジャックナイフは、多くの場合、2つの関連するが異なるプロセスを指します。どちらのプロセスもリーブワンアウトアプローチに依存しているため、この混乱が生じます。

あるコンテキストでは、ジャックナイフを使用して母集団パラメーターとその標準誤差を推定できます。たとえば、ジャックナイフアプローチを使用して、単純な回帰モデルの勾配と切片を推定するには、次のようにします。

  1. 利用可能なすべてのデータを使用して、勾配と切片を推定します。
  2. 1つの観測値を省略し、勾配と切片を推定します(係数の「部分推定」とも呼ばれます)。
  3. 勾配と切片の「部分推定」と「全データ」推定の差を計算します(係数の「疑似値」とも呼ばれます)。
  4. データセット全体に対して手順2と3を繰り返します。
  5. 各係数の擬似値の平均を計算します-これらは、勾配と切片のジャックナイフ推定です

係数の擬似値とジャックナイフ推定値を使用して、標準誤差、したがって信頼区間を決定することもできます。通常、このアプローチは、より良い、より保守的な不確実性の尺度であるため、係数の信頼区間を広くします。また、このアプローチは、係数の偏りのジャックナイフ推定値を取得するためにも使用できます。

他のコンテキストでは、モデルのパフォーマンスを評価するためにジャックナイフが使用されます。この場合、jackknife = leave-one-outクロス検証。両方とも、キャリブレーションデータセットから1つの観測値を除外し、モデルを再キャリブレーションし、除外された観測値を予測することを指します。基本的に、各観測は、予測子の「部分的な推定」を使用して予測されています。

以下は、オンラインで見つけたジャックナイフに関する素敵な記事です。https//www.utdallas.edu/~herve/abdi-Jackknife2010-pretty.pdf


1
私が間違っていない限り(そして間違いないかもしれません)、最初のコンテキストではleave-one-out クロス検証について説明しています。
アレクシス

2
LOOを使用してパラメーターを推定するという考えと(LOOCVのように)残された値を推定するという考えを分離していました。私はそれらを2つの関連するがわずかに異なるプロセスと考えていますが、おそらく両方をLOOCVと呼ぶことができますか?私も間違っている可能性があります。
jcmb
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.