オンラインで見つけた意思決定ツリーを正しく解釈しているかどうかを調べています。
このディシジョンツリーの従属変数は、BradまたはGoodの2つのクラスを持つ信用格付けです。このツリーのルートには、このデータセット内のすべての2464の観測が含まれています。
良いまたは悪い信用格付けを分類する方法を決定する最も影響力のある属性は、収入レベル属性です。
私たちのサンプルでは、収入が低かった人々の大半(553人中454人)の信用格付けも悪かった。プレミアムクレジットカードを無制限にローンチする場合、これらの人々は無視する必要があります。
この決定木を予測に使用して新しい観測値を分類する場合、葉のクラスの最大数が予測として使用されますか?たとえば、観察xは中程度の収入、7枚のクレジットカード、34歳です。信用格付けの予測分類=「良い」
別の新しい観察結果は、観察Yである可能性があります。これは低収入に満たないため、信用度は「悪い」です。
これは決定木を解釈する正しい方法ですか、それとも完全に間違っていますか?