具体的な例や課題は考えていません。私はbスプラインを使うのが初めてで、この関数を回帰のコンテキストでよりよく理解したかったのです。
応答変数といくつかの予測子x 1、x 2、との関係を評価したいとします。。。、x p。予測子には、いくつかの数値変数といくつかのカテゴリカル変数が含まれています。
回帰モデルを当てはめた後、数値変数の1つ、たとえばが有意であるとしましょう。その後の論理的ステップは、オーバーフィッティングなしで関係を適切に説明するために、高次多項式、たとえばx 2 1とx 3 1が必要かどうかを評価することです。
私の質問は:
どの時点で、bスプラインまたは単純な高次多項式を選択しましたか。例:R:
y ~ poly(x1,3) + x2 + x3
対
y ~ bs(x1,3) + x2 + x3
プロットを使用して、これら2つの間の選択を通知する方法と、プロットから本当に明確でない場合はどうなるか(例:大量のデータポイントが原因)
とx 3の間の双方向相互作用項をどのように評価しますか
上記の方法は、モデルの種類によってどのように変わりますか
高次多項式を使用せず、常にBスプラインをフィッティングして高い柔軟性にペナルティを課すことを検討しますか?
mgcv
いるかを考えると、(一般化された)加法モデルを使用しないのはなぜですか。滑らかさの選択は自動的に行われ、推論方法は十分に開発されています。