私はこの質問を読みました:XGBoostの重要性の出力をどのように解釈しますか?機能の重要性の3つの異なるタイプについて:頻度(Python XGBoostでは「ウェイト」と呼ばれます)、ゲイン、カバー。
私の場合、周波数メトリックに基づいて非常に重要度が低い機能であるジェンダーがありますが、ゲインとカバーメトリックの両方に基づいて、最も重要な機能です。
私が予測していることでは、性別が重要であることを知っています。性別とターゲットのみをプロットすると、明確な相関関係があります。それが最も重要な機能であることには驚かない。なぜそれが周波数メトリックに基づいて重要な機能と見なされないのか知りたいだけです。