線形回帰を使用して、実際には常に負ではない値を推定しています。予測変数も負ではありません。たとえば、給与を予測するために、教育年数と年齢を後退させます。この場合、すべての変数は常に負ではありません。
負の切片が原因で、私のモデル(OLSで決定された)はいくつかの負の予測になります(すべての値の範囲に対して予測変数の値が低い場合)。
このトピックはすでにここで説明されており、0でインターセプトを強制することは推奨されないことも承知しているため、このモデルを使用する必要があるものとして受け入れる必要があるようです。しかし、ここでの私の質問は、そのようなモデルを評価するときに受け入れられる規範とルールについてです。ここに特別なルールはありますか?具体的には:
- 負の見積もりが出た場合、0に丸めることはできますか?
- 観測値が100であり、予測値が-300であり、可能な最小値が0であることがわかっている場合、エラーは400または100ですか?たとえば、MEとRMSEを計算する場合。
それが議論に関連している場合:私は単純な線形回帰と多重線形回帰の両方を使用しました。どちらもいくつかの負の値になります。
編集:
以下は、適合のあるサンプルの例です。
線形回帰の係数は0.0010(x)および-540(切片)です。
Xにログを使用すると、次のようになります。
ここで線形回帰は適切ですか?