バランススコアを予測し、いくつかの異なる回帰方法を試しました。気づいたことの1つは、予測値に何らかの上限があるように見えることです。つまり、実際のバランスはですが、私の予測は約達しています。次のプロットは、実際のバランスと予測されたバランス(線形回帰で予測)を示しています。0.8
そして、同じデータの2つの分布プロットを次に示します。
私の予測変数は非常に歪んでいるため(べき法則分布のユーザーデータ)、結果を次のように変更するBox-Cox変換を適用しました。
これは予測の分布を変更しますが、その上限はまだあります。だから私の質問は:
- 予測結果のそのような上限の考えられる理由は何ですか?
- 実際の値の分布に対応するように予測を修正するにはどうすればよいですか?
おまけ: Box-Cox変換後の分布は、変換された予測子の分布に従うように見えるので、これが直接リンクされている可能性はありますか?その場合、分布を実際の値に合わせるために適用できる変換はありますか?
編集: 5つの予測子を持つ単純な線形回帰を使用しました。