Matlabでニューラルネットワークツールボックスを使用すると、このことがわかりにくくなりました。
生データセットを3つの部分に分割しました。
- トレーニングセット
- 検証セット
- テストセット
多くのトレーニングまたは学習アルゴリズムでは、データは多くの場合、トレーニングセットとテストセットの2つの部分に分かれています。
私の質問は:
- 検証セットとテストセットの違いは何ですか?
- 検証セットは本当にニューラルネットワークに固有ですか?または、オプションです。
- さらに進むと、機械学習のコンテキストでの検証とテストに違いはありますか?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.