回帰モデルの分散の説明


12

これは簡単な説明かもしれません(とにかく期待しています)。

回帰ツールボックスを使用して、Matlabで回帰分析を行いました。しかし、私はこれを述べる研究に出くわしました:

「回帰分析を使用すると、分散の60%を説明する4つの音響特性のみを使用して予測モデルを設定することができました。」

必要に応じて、記事へのリンクはこちらです: 記事

私はこれが何を意味するのか100%はわかりませんが、そのシンプルなものを望んでいます。また、60%は良いことですか?私はこれを検索しようとしましたが、「分散」という単語の前には常にパーセンテージがあるため、答えを見つけるのは難しいです。

回答:


8

これを簡単な言葉で説明しようと思います。

回帰モデルは、従属変数と一連の独立変数との関係に焦点を当てています。従属変数は、1つまたは複数の独立変数を使用して予測しようとしている結果です。

次のようなモデルがあると仮定します。

Weight_i = 3.0 + 35 * Height_i +ε

さて、明らかな疑問の1つは、このモデルがどの程度うまく機能するかということです。つまり、どれだけ高さの人の正確な予測-または説明 - 重量その人のか?

この質問に答える前に、まず、人の体重にどの程度の変動があるかを理解する必要があります。私たちがここでやろうとしているのは、身長を使って、異なる人々の体重の変動(変動)を説明することであるため、これは重要です。人々の身長がこの体重の変化を説明できるなら、良いモデルがあります。

分散は、それは数字のセットは、(それらの平均値から)広がっているどこまで対策として、この目的のために使用されるメトリック良いです。

これは、元の質問を言い換えるのに役立ちます:身長によって、人の体重の変動はどれくらい説明できるか

これが「%分散の説明」の由来です。ところで、回帰分析の場合、相関係数と等しくなります R-squaredにます。

上記のモデルのために、私たちはのような文にすることができるかもしれません:使用して回帰分析を、使用して予測モデルを設定することが可能であった高さを説明し、人の分散の60%にします体重

さて、60%はどれくらい良いですか?これについて客観的な判断を下すことは困難です。しかし、他の競合モデル(たとえば、人の年齢を使用して体重を予測する別の回帰モデル)がある場合、それらによって説明される分散の量に基づいて異なるモデルを比較し、より良いモデルを決定できます。(これにはいくつかの注意事項があります。「回帰の解釈と使用」-Christopher H. Achen http://www.sagepub.in/books/Book450/authorsを参照してください


1
それは確かに私の質問の大部分に答えました。著者がこれを非常に重要なことのように述べている理由に関しては、私は知りません。したがって、これがR sqaured値であり、例に戻ると、80%の分散を持つ「年齢」のモデルを使用し、85の分散を持つ「高さ」のモデルを使用したとしましょう%の人の体重を予測するために、後者のモデルがより重要だと思いますか?本のリンクのおかげで、私はこれから先月購入しました。これは、今後数か月で回帰分析を非常に多く使用するからです。
user1574598

1
はい、後者のモデルの方が、人のセトリスパリバスの体重を予測(または説明)する能力が優れていると結論付けることができます。ところで、あなたはこれを「モデルは80%の分散を持っている」と述べましたが、「モデルは分散の80%を説明している」はずです。
ヴィシャル

4

R2

=1ny^y¯2=1nyy¯2

yy^番目y¯R2

=1nyy¯2==1ny^y¯2+=1nyy^2

R2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.