これが小さすぎる場合は申し訳ありませんが、私はこの答えをできるだけ自己完結型にしたかっただけです。実際、あなたが説明していることを行うことはできません:次数の最高の多項式k+1 常に、少なくとも次数の最良の多項式に適合します k、セット k+1 次数多項式にはすべてが含まれます k 次数多項式(設定するだけ ak+1=0)。増え続けるにつれてk、ある時点で、データに完全に適合する(つまり、エラーがゼロの)多項式を見つけることができます。
これは通常、非常に魅力的なソリューションではありません。たとえば、100万次多項式で説明する必要があるプロセスを想像することは困難であり、この種のモデルは、データを適切に説明するために必要なものより複雑であることはほぼ確実です。この現象はオーバーフィッティングと呼ばれ、良い例がこのウィキペディアの画像です。データは明らかに線形に近いですが、より複雑なモデルでエラーを低くすることは可能です(ただし望ましくありません)。
一般的に、目標は、誤差最小化することであるだろうと同じ基礎となるモデルからの新しいデータではなく、データの現在のセットで発生します。多くの場合、より多くのデータを取得することは不可能または実用的ではないため、通常、何らかの形の交差検証を使用して、目に見えないデータに最適化されたモデルを一般化します。相互検証には多くの形式があり、Wikipediaの記事やCrossValidated(ha!)に関する多数の回答でそれらについて読むことができます。しかし実際には、これらすべてを次のように削減できます。一部のデータにモデルを適合させ、これを使用して残りのデータの値を予測します。これを繰り返して、平均して最高のパフォーマンスが得られるモデル(この場合は多項式の次数)を選択します。