線形回帰が不可能である負の推定を与える場合の対処法


8

線形回帰を使用して、実際には常に負ではない値を推定しています。予測変数も負ではありません。たとえば、給与を予測するために、教育年数と年齢を後退させます。この場合、すべての変数は常に負ではありません。

負の切片が原因で、私のモデル(OLSで決定された)はいくつかの負の予測になります(すべての値の範囲に対して予測変数の値が低い場合)。

このトピックはすでにここで説明されており、0でインターセプトを強制することは推奨されないことも承知しているため、このモデルを使用する必要があるものとして受け入れる必要があるようです。しかし、ここでの私の質問は、そのようなモデルを評価するときに受け入れられる規範とルールについてです。ここに特別なルールはありますか?具体的には:

  • 負の見積もりが出た場合、0に丸めることはできますか?
  • 観測値が100であり、予測値が-300であり、可能な最小値が0であることがわかっている場合、エラーは400または100ですか?たとえば、MEとRMSEを計算する場合。

それが議論に関連している場合:私は単純な線形回帰と多重線形回帰の両方を使用しました。どちらもいくつかの負の値になります。


編集:

以下は、適合のあるサンプルの例です。

線形フィット

線形回帰の係数は0.0010(x)および-540(切片)です。

Xにログを使用すると、次のようになります。

ログ

ここで線形回帰は適切ですか?


3
モデルの指定が間違っています。別の種類のモデルが必要です。データが0を下回ることができず、モデルがそれを下回ることができる場合、モデルはデータの現実を反映していません。この違いは、状況によっては心配するほど大きな問題ではないかもしれませんが、ここではそうではないようです。
ガン-モニカの回復

@gung、私はプロットで質問を更新しました。
月)

1
@gung、関連性がないと思うので、あまり詳細に説明するのは避けたいので、XとYはどちらも収入、年齢、降水量などの変数であり、負になることはありません。
月)

2
詳細は、XとYがどのようなデータであり、それらの間でどのような関係が可能であるかに明確に関連しています。詳細情報なしでアドバイスできることには、非常に現実的な制限があります。
-モニカの

1
何かを変換する場合は、XではなくYにする必要があります。また、Xを変換しても問題は直接解決されません。しかし、ポアソン回帰をチェックしてください。例:blog.stata.com/tag/poisson-regression
Nick Cox

回答:


5

コンテキストを指定していませんが、1つの解決策を提供する投稿にリンクしています。その解決策はここでは適用できないと思います。

次に、別の解決策は、線形回帰(単純または複数)を使用しないことです。これらは、問題を解決しないためです。

ただし、まず、年齢と教育の関数として収入を使用してみましょう。ここでは、おそらく新生児の収入に関心がないので、負の予測値は妥当です。ただし、データセットの一部の人々に収入がない場合を除いて、log(income)を取ることも妥当です。

しかし、それはそれではないと仮定します。次に、従属変数の範囲を尊重する回帰法を使用できます。その1つがベータ回帰であり、これには0〜1のDVが必要です。そのため、DVを0〜1にスケーリングしてからベータ回帰を使用できます。

ただし、実際の変数を質問に追加することを強くお勧めします。


ご回答有難うございます。役に立つかもしれないプロットで質問を更新しました。
月)

コンテキストを与えていない、XとYが何であるか、Yが0を下回らない理由を述べていないため、誰かがあなたを助ける方法はありません。ただし、質問で提案する解決策はすべて悪いものです。
Peter Flom
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.