回答:
まず、評価のための十分なデータがあるプロットの右側に注目する必要があります。
2つの曲線が「互いに近く」、両方とも曲線であるが、スコアが低い場合。モデルに適合不足の問題があります(高バイアス)
トレーニングカーブのスコアがはるかに優れているが、テストカーブのスコアが低い場合、つまり2つのカーブの間に大きなギャップがある場合。次に、モデルは過剰適合問題(高分散)に悩まされます。
プロットから、モデルが良好かどうかを判断するのは困難です。あなたは本当に「簡単な問題」を抱えている可能性があり、良いモデルは90%を達成することができます。一方で、私たちができる最善のことは70%を達成することが本当に「難しい問題」である可能性があります。(完全なモデルが得られるとは思わないかもしれません。たとえば、スコアは1です。達成できる量は、データ内のノイズの量によって異なります。何をしても、スコアで1を達成することはできません。)
あなたの例のもう一つの問題は、350の例が実際のアプリケーションでは小さすぎるように見えることです。
理解を深めるために、次の実験を行って、オーバーフィッティングの下で経験し、学習曲線で何が起こるかを観察できます。
MNISTデータなどの非常に複雑なデータを選択し、1つの特徴を持つ線形モデルなどの単純なモデルに適合させます。
SVMなどの複雑度モデルに適合する単純なデータ(虹彩データなど)を選択します。
さらに、アンダーフィットとオーバーフィットに関連する2つの例を示します。これは学習曲線ではなく、勾配ブースティングモデルの反復回数に対するパフォーマンスに関するものであることに注意してください。x軸は反復回数を示し、y軸はパフォーマンスを示します。これはROCの負の領域です(低いほど良い)。
左側のサブプロットはオーバーフィッティングの影響を受けません(パフォーマンスがかなり良いため、アンダーフィッティングもよくありません)が、右側のサブプロットは反復回数が多い場合にオーバーフィッティングの影響を受けます。