これは、同僚の何人かが従う練習や方法に関する質問です。ロジスティック回帰モデルの作成中に、カテゴリ変数(またはビニングされた連続変数)をそれぞれの証拠の重み(WoE)に置き換える人々を見てきました。これは、リグレッサーと従属変数の間に単調な関係を確立するために行われると思われます。私の知る限り、モデルが作成されると、方程式の変数はデータセットの変数ではありません。むしろ、方程式の変数は、従属変数を分離する際の変数の重要性や重みのようなものになりました!
私の質問は、どのようにモデルまたはモデル係数を解釈するのですか?たとえば、次の方程式の場合:
は、変数 1単位増加に対する比の相対的増加であると言えます。
しかし、変数がそのWoEに置き換えられた場合、解釈は次のように変更されます。
私はインターネットでこの実践を見てきましたが、この質問の答えはどこにも見つかりませんでした。このコミュニティ自体からのこのリンクは、誰かが書いた似たようなクエリに関連しています:
WoEは、ロジスティック回帰の従属変数であるオッズ比の自然対数との線形関係を表示します。したがって、変数の実際の値の代わりにWoEを使用する場合、ロジスティック回帰ではモデルの誤指定の問題は発生しません。
しかし、まだ説明がわかりません。不足しているものを理解してください。