ここでは、@ Yuanningの回答と@cbeleitesのコメントから収集したものを、疑似コード形式で再評価しています。これは私のような人に役立つかもしれません。
決定されたモデルのパフォーマンスを測定するには、トレーニングとテストのセットのみが必要です。
function measure_performance(model, full_test_set, k_performance):
subset_list <- divide full_test_set into k_performance subsets
performances <- empty array
for each sub_set in subset_list:
test_set <- sub_set
training_set <- the rest of the full_test_set
model <- train model with training_set
performance <- test model with test_set
append performance to performances
end for each
return mean of the values in peformances
end function
しかし、モデルを選択する必要がある場合は、次のようにする必要があります。
function select_model(data, k_select, k_performance):
subset_list <- divide data into k_select subsets
performances <- empty array
for each sub_set in subset_list:
validation_set <- assume that this sub_set is validation set
test_set <- one other random sub_set (Question: How to select test_set)
training_set <- assume remaining as training set
model <- get a model with the help of training_set and validation_set
performance <- measure_performance(model,test_set, k_performance)
end for each
return model with the best performance (for this, performances will be scanned)
end function