欠損値を処理するために決定木学習アルゴリズムが使用する方法は何ですか。
missingと呼ばれる値を使用して、単にスロットをいっぱいにしますか?
ありがとう。
欠損値を処理するために決定木学習アルゴリズムが使用する方法は何ですか。
missingと呼ばれる値を使用して、単にスロットをいっぱいにしますか?
ありがとう。
回答:
さまざまな決定木で使用されるいくつかの方法があります。欠損値を単に無視する(ID3や他の古いアルゴリズムのように)か、欠損値を別のカテゴリとして扱う(名目上の特徴の場合)ことは、欠損値を実際に処理することではありません。ただし、これらのアプローチは、ディシジョンツリー開発の初期段階で使用されていました。
欠損データに対する実際の処理アプローチでは、分割の評価で欠損値を持つデータポイントを使用しません。ただし、子ノードが作成およびトレーニングされると、それらのインスタンスは何らかの形で分散されます。
欠損値インスタンスを子ノードに配布する次のアプローチについて知っています。