回答:
必ずしも何もする必要はありません。予測子が正常に機能する可能性があります。偶数予測子(ある、使用可能性の範囲を予測クランプ範囲外の値を外挿し、もしの代わりにハット{Y}は\)尽くします上手。モデルを相互検証して、これが機能するかどうかを確認します。
ただし、制限された範囲は、従属変数()と独立変数()の間の非線形関係の可能性を高めます。これのいくつかの追加の指標は次のとおりです。
範囲の両端の残差の変動と比較して、がその範囲の中央にある場合の残差値の変動が大きくなります。
特定の非線形関係の理論的理由。
モデルの仕様の誤りの証拠(通常の方法で取得)。
x_iの2次または高次の項の重要性。
これらの条件のいずれかが当てはまる場合、yの非線形再表現を検討してください。
yを再表現してx_iとの線形関係を作成する方法は多数あります。たとえば、間隔[0,70]で定義された増加関数は、y \ to f(y)-f(70-y)を介して対称増加関数を作成するために「折り畳む」ことができます。場合fは任意の大きさと負になる引数が近づくにつれて0を、の折り返しバージョンfがマップされます[0,70]すべての実数に。そのような関数の例には、対数と負のべき乗が含まれます。対数の使用は、@ user603が推奨する「logitリンク」と同等です。別の方法は、G任意の確率分布の逆CDFであり、f(y)= G(y / 70)を定義します。正規分布を使用すると、「プロビット」変換が行われます。
変換の家族を活用する一つの方法は、実験にある:、可能性の高い変換を試みる変換の迅速な回帰を実行反対残差、およびテスト:彼らはの予測値に依存しないように表示されます(等分散と相関しません) 。これらは、独立変数との線形関係の兆候です。逆変換された予測値の残差が小さくなる傾向がある場合にも役立ちます。これは、変換により適合が改善されたことを示します。外れ値の影響に抵抗するには、反復的に再重み付けされた最小二乗法などの堅牢な回帰方法を使用します。
データ変換:収まるようにデータを再スケーリングし、ロジットリンクを備えたglmモデルを使用してデータをモデル化します。
編集:ベクトルを再スケーリングする(つまり、すべての要素を最大のエントリで分割する)場合、原則として、それを行う前に、外れ値のスクリーン(目玉)を作成します。
更新
Rにアクセスできると仮定すると、モデリングパーツには堅牢な glmルーチンが含まれます。パッケージを参照してください。