回答:
一般的に言えば、情報値は、変数が、いくつかのターゲット変数Yのバイナリ応答(たとえば、「良い」と「悪い」)をどれだけ区別できるかを示します。アイデアは、変数Xの情報値が低い場合、ターゲット変数を分類するのに十分な仕事をしていない可能性があるため、説明変数として削除されます。
これがどのように機能するかを確認するには、をn個のビンにグループ化します。それぞれのx ∈ X相当するY ∈ Y 2つの値のいずれかをとることができ、ビン、次いで0または1を言うX I、1 ≤ iが≤ N、
どこ
の 0 '内の X iは)/(#の 0 'におけるS X )=の割合 0ビン内のが私のすべてのビン対
の 1 '内の X iは)/(#の 1 '内の Xは)=の割合 1ビン内のを私はすべてのビン対
は、証拠の重み(ビン X iの場合)とも呼ばれます。カットオフ値は異なる場合があり、選択は主観的なものです。私はよく I V < 0.3を使用します(以下の[1]もそうです)。
クレジットスコアリングのコンテキストでは、これら2つのリソースが役立ちます。
[1] http://www.mwsug.org/proceedings/2013/AA/MWSUG-2013-AA14.pdf
[2] http://support.sas.com/resources/papers/proceedings12/141-2012.pdf