最近、私の友人に、ディシジョンツリーアルゴリズムが線形アルゴリズムであるか非線形アルゴリズムであるかがインタビューで尋ねられました。この質問への回答を探しましたが、満足のいく説明が見つかりませんでした。誰でもこの質問の解決策に答えて説明できますか?また、非線形機械学習アルゴリズムの他の例は何ですか?
最近、私の友人に、ディシジョンツリーアルゴリズムが線形アルゴリズムであるか非線形アルゴリズムであるかがインタビューで尋ねられました。この質問への回答を探しましたが、満足のいく説明が見つかりませんでした。誰でもこの質問の解決策に答えて説明できますか?また、非線形機械学習アルゴリズムの他の例は何ですか?
回答:
決定木は非線形です。線形回帰とは異なり、独立変数と従属変数の関係を表す方程式はありません。
例:
線形回帰-果物の価格= b0 + b1 *鮮度+ b2 *サイズ
決定木-ノード:熟した-はいまたはいいえ| フレッシュ-はいまたはいいえ| サイズ-<5、> 5が<10および> 10 |
2番目のケースでは、独立変数と従属変数の間に線形関係はありません。
決定木は非線形分類器です。データセットに一貫したサンプルが含まれている場合、つまり、同じ入力フィーチャと矛盾するラベルがない場合、デシジョンツリーはデータを完全に分類し、それをオーバーフィットできます。より明確にするために、決定木の次元はあり、はバイナリフィーチャの数を表します。その結果、仮説空間には、決定木を使用して処理できる異なる可能性が含まれます。重要なポイントの1つは、デシジョンツリーに含めることができるリーフの数です。バイナリ機能を持つサンプルがあるとします。それぞれの量に応じて、可能性の数は。デシジョンツリーは、線形に分離可能かどうかに関係なく、トレーニングデータセットをオーバーフィットできます。そのため、人々はツリーの剪定ID3
またはC4.5
ツリーの剪定、またはツリーの高さと長さのしきい値の設定にアプローチを使用します。データ。