これを簡単な言葉で説明しようと思います。
回帰モデルは、従属変数と一連の独立変数との関係に焦点を当てています。従属変数は、1つまたは複数の独立変数を使用して予測しようとしている結果です。
次のようなモデルがあると仮定します。
Weight_i = 3.0 + 35 * Height_i +ε
さて、明らかな疑問の1つは、このモデルがどの程度うまく機能するかということです。つまり、どれだけ高さの人の正確な予測-または説明 - 重量その人のか?
この質問に答える前に、まず、人の体重にどの程度の変動があるかを理解する必要があります。私たちがここでやろうとしているのは、身長を使って、異なる人々の体重の変動(変動)を説明することであるため、これは重要です。人々の身長がこの体重の変化を説明できるなら、良いモデルがあります。
分散は、それは数字のセットは、(それらの平均値から)広がっているどこまで対策として、この目的のために使用されるメトリック良いです。
これは、元の質問を言い換えるのに役立ちます:身長によって、人の体重の変動はどれくらい説明できるか
これが「%分散の説明」の由来です。ところで、回帰分析の場合、相関係数と等しくなります R-squaredにます。
上記のモデルのために、私たちはのような文にすることができるかもしれません:使用して回帰分析を、使用して予測モデルを設定することが可能であった高さを説明し、人の分散の60%にします体重。
さて、60%はどれくらい良いですか?これについて客観的な判断を下すことは困難です。しかし、他の競合モデル(たとえば、人の年齢を使用して体重を予測する別の回帰モデル)がある場合、それらによって説明される分散の量に基づいて異なるモデルを比較し、より良いモデルを決定できます。(これにはいくつかの注意事項があります。「回帰の解釈と使用」-Christopher H. Achen http://www.sagepub.in/books/Book450/authorsを参照してください)