回帰木は継続的に予測できますか?


11

ような滑らかな関数があるとしますf(x,y)=x2+y2。トレーニングセットそしてもちろん、私は知りませんが、どこでもを評価できます。F FD{((x,y),f(x,y))|(x,y)R2}ff

回帰木は関数の滑らかなモデルを見つけることができますか(したがって、入力の小さな変化は出力の小さな変化のみを与えるはずです)?

講義10:回帰ツリーで読んだことから、回帰ツリーは基本的に関数値をビンに入れるように見えます:

従来の回帰木の場合、各セルのモデルは、Yの一定の推定値です。

彼らが「クラシック」と書いているとき、細胞がより興味深い何かをするバリアントがあると思いますか?

回答:


2

回帰木、特に勾配ブースティング(本質的に多くの木)は、連続予測で非常によく機能する傾向があり、線形回帰のように本当に連続するモデルよりもパフォーマンスが優れていることがよくあります。これは、相互作用が変動する場合や、データセットが十分に大きい(10,000レコードを超える)場合に特に当てはまり、過剰適合の可能性が低くなります。主な目的が単に予測力である場合、モデルが100%連続か疑似連続かは関係ありません。回帰ツリーをより連続的にすると、サンプルの予測力が強化され、ツリーの深さを増やすか、ツリーを追加できます。


1
同意する。私のブーストされたツリーは、ほとんどの場合、丹念に作成され最適化されたGLMを上回ります。もちろん、予測力を獲得すると、解釈可能性が失われます。
プロオフリーダー

0

従来の回帰ツリーでは、葉に1つの値がありますが、葉には線形回帰モデルを設定できます。このチケットを確認してください。

木の集団(ランダムフォレストまたは勾配ブースティングマシン)を使用して、出力値を連続させることもできます。


0

質問を少し拡張して、一般的な勾配ブースティング手法を含める場合(ブーストされた回帰ツリーの特別なケースとは対照的)、答えはイエスです。勾配ブースティングは、変数選択の代替として正常に使用されています。良い例はmboostパッケージです。重要なのは、ブースティングに使用される基本学習者のクラスが、最初から連続モデルで構成されていることです。このチュートリアルでは、基本学習者の典型的なクラスを次のように説明します。

一般的に使用される基本学習者モデルは、線形モデル、スムーズモデル、および決定木という3つの異なるカテゴリに分類できます。マルコフ確率場(Dietterich et al。、2004)やウェーブレット(Viola and Jones、2001)など、他にもいくつかのモデルがありますが、それらのアプリケーションは、比較的具体的な実用的なタスクで発生します。

特にウェーブレットについて言及していることに注意してください。ツリーとウェーブレットは、以前はツリーベースのウェーブレットにうまく結合されていました


勾配ブースティングの継続的な基本学習者は何ですか?答えが決定木である場合、それらがどのように継続しているかを説明していただけませんか?
マーティントーマ

回答を更新しました。重要なのは、継続的なツリーのような予測子を使用することです。
user3605620 2016年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.