RでのGBMのn.minobsinnodeパラメーターの役割[終了]


21

GBMパッケージのn.minobsinnodeパラメーターの意味を知りたいと思いました。私はマニュアルを読みましたが、それが何をするのか明確ではありません。結果を改善するために、その数を小さくするか、大きくする必要がありますか?


9
「この質問が将来の訪問者を助けることはまずありません」。私は将来の訪問者であり、それが役に立ったと感じています。
ヒラメ

1
私もそれが役に立ったと思います。
オアハカマット

回答:


25

GBMアルゴリズムの各ステップで、新しい決定木が構築されます。決定木を成長させるときの質問は、「いつ停止するか」です。一番先に進むことができるのは、各端末ノードに観測が1つだけになるまで各ノードを分割することです。これは、n.minobsinnode = 1に対応します。または、特定の数の観測値が各ノードにある場合、ノードの分割を停止できます。R GBMパッケージのデフォルトは10です。

使用するのに最適な値は何ですか?データセットと、分類または回帰のどちらを行うかによって異なります。各ツリーの予測はターミナルノードのすべての入力の従属変数の平均として取得されるため、値1はおそらく回帰(!)にはあまりうまくいきませんが、分類には適している可能性があります。

値が大きいほどツリーが小さくなるため、アルゴリズムの実行速度が速くなり、メモリの使用量が少なくなりますが、これは考慮事項です。

一般に、結果はこのパラメーターにあまり敏感ではなく、GBMのパフォーマンスの確率的な性質を考えると、実際にどの値が「最良」であるかを正確に判断することは難しいかもしれません。一般的に、相互作用の深さ、収縮、および木の数はすべてはるかに重要です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.