さまざまなシナリオでの柔軟なモデル(スプラインなど)と柔軟性のないモデル(線形回帰など)の比較に関する簡単な質問に遭遇しました。質問は:
一般に、次の場合、柔軟な統計学習法のパフォーマンスは、柔軟性のない方法よりも良いか悪いかを予想しますか?
- 予測子の数は非常に大きく、観測値の数は少ないですか? n
- エラー項の分散、すなわちは非常に高いですか?
(1)については、が小さい場合、柔軟性のないモデルの方が良い(わかりません)と思います。(2)については、どちらのモデルが(比較的)優れているかわかりません。