GAMに適切な数のノットを選択する場合、データの数とx軸の増分を考慮に入れることができます。
x軸に100の増分があり、各増分に1000のデータポイントがある場合はどうなるでしょうか。
それらが指定されていない場合、スプラインのノットは、用語が参照する共変量値全体に均等に配置されます。たとえば、101データをxの11ノットスプラインでフィッティングすると、10番目ごとにノットが存在します(順序付け) x値。
この例では、基本的な開始は9ノットである必要がありますか?非常に小さな数から非常に大きな数までフィッティングできるため、このデータセットにどのノットの範囲が適しているかはわかりません。
set.seed(1)
dat <- data.frame(y = rnorm(10000), x = 100)
library(ggplot)
ggplot(dat, aes(x = x, y = y)) +
geom_point(size= 0.5) +
stat_smooth(method = "gam",
formula = y ~ s(x, bs = "cs"),k=9, col = "black")
k = 25が有用な適合を提供した場合、このデータに妥当でしょうか?
bs = "cs"
スプラインの用語は何をしますか?