1
パーセンタイルを予測子として使用する-良い考えですか?
線形回帰を使用して顧客のログ(支出)を予測する問題について考えています。 入力として使用する機能を検討していて、変数のパーセンタイルを入力として使用してもよいかどうか疑問に思っています。 たとえば、会社の収益を入力として使用できます。私が疑問に思っているのは、代わりに会社の収益パーセンタイルを使用できるかどうかです。 別の例は、カテゴリー産業分類子(NAICS)です。NAICSコードごとの中央値支出を見て、各NAICSコードを「NAICSパーセンタイル」に割り当てるとしたら、それは私が使用できる有効な説明変数ですか? パーセンタイルを使用するときに注意すべき問題があるかどうか疑問に思っていますか?ある意味で、ある種の特徴スケーリングと同等ですか?