k分割交差検証は、トレーニング/検証/テストセットのコンテキストでどのように適合しますか?


14

私の主な質問は、k-foldクロス検証がトレーニング/検証/テストセット(このようなコンテキストにまったく当てはまる場合)のコンテキストにどのように適合するかを理解しようとすることです。

通常、人々はデータをトレーニング、検証、およびテストセットに分割することを話します。たとえば、Andrew Ngのコースごとに60/20/20の比率で-モデルトレーニングの最適なパラメーターを識別するために検証セットが使用されます。

ただし、データ量が比較的少ない場合に、より代表的な精度測定値を取得するためにk分割交差検証を使用したい場合、k分割交差検証を実行すると、この60/20/20分割が正確に行われます。シナリオ?

たとえば、実際にトレーニングセットとテストセット(データの80%)を組み合わせ、それらに対してk分割交差検証を行って精度測定値(明示的な「テストセット」を持つことで効果的に破棄)を取得することを意味しますか?もしそうなら、どのトレーニング済みモデルを使用しますか?たとえば、aとbの考えられる答えの1つは、おそらくベストフォールドモデルを使用することです。

回答:


12

通常、相互検証は、検証セットの必要性を回避するのに役立ちます。

トレーニング/検証/テストデータセットの基本的な考え方は次のとおりです。

  1. トレーニング:トレーニングデータのハイパーパラメータの選択が異なるさまざまなタイプのモデルを試します(たとえば、特徴の選択が異なる線形モデル、レイヤーの選択が異なるニューラルネット、mtryの値が異なるランダムフォレスト)。

  2. 検証:検証セットに基づいてステップ1のモデルのパフォーマンスを比較し、勝者を選択します。これは、トレーニングデータセットを過剰に適合させることによって行われる誤った決定を回避するのに役立ちます。

  3. テスト:テストデータで勝者モデルを試して、実際のパフォーマンスを実感します。これにより、ステップ2で導入された過剰適合が解明されます。ここでは、これ以上の決定は行いません。単なるわかりやすい情報です。

これで、検証ステップを相互検証に置き換える場合、データへの攻撃はほぼ同じように行われますが、トレーニングとテストデータセットしかありません。検証データセットは必要ありません。

  1. トレーニング:上記を参照してください。

  2. 検証:トレーニングデータを相互検証して、相互検証のパフォーマンスに関してステップ1の最適なモデルを選択します(ここで、元のトレーニングデータは一時的なトレーニングと検証セットに繰り返し分割されます)。相互検証で計算されたモデルは、ステップ1の最適なモデルを選択するためにのみ使用されます。これらのモデルはすべて、完全なトレーニングセットで計算されます。

  3. テスト:上記を参照してください。


1
ありがとう!確認するために、CVのコンテキストでは、80%のトレーニングと20%のテストの分割がある場合があります。次に、そのデータの80%でモデルを構築し、20%に対してテストして精度を得ることができます。さまざまなモデルのバリエーションを試すには、トレーニングデータセット(データの80%)で10倍のCVを実行します-合計データの8%で効果的にトレーニングし、各分割で合計データの72%に対してテストします。CV結果に基づいて、最適なハイパーパラメーター値を特定し、それらを使用してすべてのトレーニングデータ(完全なデータセットの80%)でトレーニングされた新しいモデルを構築し、残りの20%のテストデータセットに対してテストできます。正しい?
ブルー

3
はい。ただし、CVを実行するたびに、トレーニングに72%、検証に8%を使用します;-)
Michael M

素晴らしい応答@MichaelM。ネストされた相互検証(NCV)について読んでいて、それを使用するか、CVで概説したことを行うかを判断するのに苦労しています。そして私が理解しているように、NCVはステップ3に適用されます。1つの勝者スコアを取得する代わりに、Kの勝者スコア(合計実行数をKで乗算し、ステップ1-2をK回繰り返し、差分80%の列車データ)を取得して、平均化できます。だから質問:1)私の理解は正しいですか?2)NCVを使用することをお勧めしますか?
Aziz Javed

あなたはまさに正しいです。ネストされたCVは、上記で概説した「単純な」アプローチよりも信頼できる見積もりを得るのに役立ちます。時間が許せば、それは間違いなくオプションです。ネストされたCVで最終モデルが計算されるデータセットを知っていますか?全部?
マイケルM

3

K

トレーニング/検証/テストに分割することも、サンプリング戦略です。

K

K1

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.