K-fold cross-validation(CV)はデータをランダムにK個のパーティションに分割し、それらのK個のパーツの1つをテストケースとして保持し、他のK-1パーツをトレーニングデータとしてまとめます。Leave One Out(LOO)は、N個のデータアイテムを取得してN-fold CVを実行する特殊なケースです。ある意味では、ホールドアウトは別の特殊なケースであり、テストとしてKフォールドの1つだけを選択し、すべてのKフォールドを回転させません。
私の知る限り、10倍CVはデータを効率的に使用し、また不幸なパーティション選択を回避するのに役立つため、ほぼ間違いありません。Hold Outはデータを効率的に使用せず、LOOはそれほど堅牢(またはそのようなもの)ではありませんが、10倍のフォールドが適切です。
データに複数のカテゴリが含まれ、1つ以上のカテゴリが他のカテゴリよりもはるかに小さいことがわかっている場合、Kランダムパーティションの一部には小さなカテゴリがまったく含まれていない可能性があり、これは悪いことです。各パーティションが合理的に代表的であることを確認するには、階層化を使用します。データをカテゴリに分割し、各カテゴリからランダムに比例して選択してランダムパーティションを作成します。
K折り畳みCVのこれらのバリエーションはすべて、置換なしでデータから選択します。ブートストラップは置換するデータを選択するため、同じデータを複数回含めることができ、一部のデータがまったく含まれない場合があります。(各「パーティション」には、各パーティションにN / K個のアイテムがあるKフォールドとは異なり、N個のアイテムもあります。)
(ただし、CVでブートストラップがどのように使用されるかを正確に知らないことを認める必要があります。テストとCVの原則は、トレーニングしたデータでテストしないことを確認することです。実際の世界でテクニックと係数がどのように機能するかについてのより現実的なアイデア)
編集:コメントごとに明確にするために、「ホールドアウトは効率的ではありません」を「データを効率的に使用しないホールドアウト」に置き換えられました。