ブートストラップは、置換を伴うランダムサンプリングに依存する任意のテストまたはメトリックです。これは、予測モデルパフォーマンスの検証、アンサンブルメソッド、モデルのパラメーターのバイアスと分散の推定など、多くの状況で役立つ方法です。元のデータセットから置き換えてサンプリングを実行し、同時に、選択されていないデータポイントがテストデータセットであると想定します。この手順を数回繰り返し、モデルパフォーマンスの推定として平均スコアを計算できます。また、ブートストラップはアンサンブルトレーニング手法に関連しています。これは、各ブートストラップデータセットを使用してモデルを構築し、多数の投票(分類用)またはすべての平均(数値予測用)を使用してこれらのモデルをアンサンブルに「バッグ」できるためです。これらのモデルを最終結果として。
相互検証は、モデルのパフォーマンスを検証するための手順であり、トレーニングデータをk個の部分に分割することによって行われます。k-1の部分はトレーニングセットであり、他の部分はテストセットであると想定します。毎回、データの異なる部分を保持しながら、k回繰り返すことができます。最後に、kスコアの平均をパフォーマンス推定として使用します。相互検証は、バイアスや差異の影響を受ける可能性があります。分割数を増やすと、分散も増加し、バイアスが減少します。一方、分割数を減らすと、バイアスが増加し、分散が減少します。
要約すると、相互検証は、使用可能なデータセットを分割して複数のデータセットを作成し、ブートストラップ法は元のデータセットを使用して、置換後のリサンプリング後に複数のデータセットを作成します。ブートストラップは、モデル検証に使用される場合、クロス検証ほど強力ではありません。ブートストラップは、アンサンブルモデルの構築またはパラメーターの推定のみを目的としています。