2つの変数を使用して単純な線形最小二乗回帰を行うための適切なモデルを、どのようにして客観的に(「アルゴリズム的に」読み取る)選択できますか?
たとえば、データが2次傾向を示しているように見え、データに非常によく適合する放物線が生成されたとします。これを回帰にすることをどのように正当化しますか?または、より良いモデルが存在する可能性を排除するにはどうすればよいですか?
私が本当に心配しているのはこれです。データセット(点の補間)に完全に適合するまで、多項式の項を追加し続けるだけで、エラーはまったく発生しません。しかし、「モデル」が実際に適切であると考える理由がないため、これは予測または外挿に関しては役に立たないでしょう。では、正確さと直感的な魅力のニーズのバランスをどのように取るのでしょうか?
(また、これが以前に尋ねられたことがある場合は、私に警告してください。そうであったと思いますが、何も見つかりませんでした。)