R-squaredは本当に非線形モデルの無効なメトリックですか?


8

SSR + SSE = SSTotalの関係が成立しないため、非線形二乗モデルではR-2乗が無効であることを読みました。これが真実である理由を誰かが説明できますか?

SSRとSSEは、回帰ベクトルと残差ベクトルの二乗ノルムであり、成分はそれぞれとです。これらのベクトルが互いに直交している限り、予測子の値を当てはめられた値にマップするために使用される関数の種類に関係なく、上記の関係が常に成り立つとは限りません。thY^Y¯YY^

さらに、最小二乗の定義により、任意の最小二乗モデルに関連付けられた回帰ベクトルと残差ベクトルは直交しませんか?残差ベクトルは、ベクトルと回帰ベクトルの差です。残差/差分ベクトルが直交しないような回帰ベクトルの場合、回帰ベクトルに定数を掛けて、残差/差分ベクトルと直交するようにすることができます。これにより、残差/差分ベクトルのノルムも減少します。YY¯

これをうまく説明できなかった場合は、教えてください。明確にするように努めます。


1
はいつでも計算できるので「無効」と見なすことができるのはどのような意味ですか?正確にはどのような目的で?R2
whuber

4
これは、数量の定義方法に部分的に依存します。観測された応答と適合された応答の間の相関の2乗を記述統計として慎重に使用しても、害はほとんどありませんが、必ずしも非線形回帰が最大化するものではありません。重要なのは、または重要なのは、非線形回帰が何らかの科学的(エンジニアリング、医療など)の理論的根拠または少なくとも妥当性を備えた関数形を利用することです。これは、適合の良し悪しの程度を定義するコンテキストです。一番便利。
Nick Cox

@whuber申し訳ありませんが、投稿された当初のコメントは表示されませんでした。複数の理由により、R二乗は非線形のケースでは無効と見なされますが、私はそれが間違っていると信じていたため、線形性に違反している場合、SSE + SSR = / = SSTotalの主張に主に焦点を当てていました。
グレッグ

回答:


6

線形回帰の二乗和は、一般化線形モデルにおけるより一般的な逸脱値の特殊なケースです。より一般的なモデルでは、(切片項を含む)説明変数の線形関数にリンクされた平均の応答分布があります。GLMの3つの逸脱統計は、次のように定義されます。

Null Deviance   DTOT=2(^S^0),Explained DevianceDREG=2(^p^0),Residual Deviance  DRES=2(^S^p).

これらの式では、値 ^S 飽和モデルの下で最大化された対数尤度です(データポイントごとに1つのパラメーター)。 ^0 nullモデル(切片のみ)での最大化された対数尤度です。 ^p モデルの下で最大化された対数尤度です(切片項と p 係数)。

これらの逸脱統計は、線形回帰における二乗和のスケーリングされたバージョンに類似した役割を果たします。それらが分解を満たすことは簡単にわかりますDTOT=DREG+DRES、これは線形回帰における二乗和の分解に類似しています。実際、線形リンク関数を持つ正規応答分布がある場合、線形回帰モデルが得られ、逸脱度統計は次のように減少します。

DTOT=1σ2Σ=1yy¯2=1σ2SSTOTDREG=1σ2Σ=1y^y¯2=1σ2SSREGDRES=1σ2Σ=1yy^2=1σ2SSRES

ここで、線形回帰モデルの変動係数は、説明変数に起因する応答の総変動の割合を測定する適合度統計です。GLMの場合の自然な拡張は、統計を形成することです。

RGLM2=1DRESDTOT=DREGDTOT

スケーリング値が相殺されるため、この統計が線形回帰の特別な場合の変動係数に減少することが容易にわかります。GLMのより広いコンテキストでは、統計には、線形回帰の解釈に類似した自然な解釈があります。モデルの説明変数によって説明されるnull逸脱の割合を示します。

線形回帰の二乗和がGLMの偏差にどのように拡張されるかを見てきたので、非線形モデルでは通常の変動係数が不適切であることがわかります。これは、正規分布誤差項をもつ線形モデル。それにもかかわらず、標準変動係数は不適切ですが、逸脱値を使用して、類似の解釈で適切な類似性を形成することが可能であることがわかります。


残差の逸脱は、単に逸脱と呼ばれることもあります。


1
便利な投稿ありがとうございます。この一般的なR2 1-DRES / DTOTにはbtwという名前がありますか?私は時々それをマクファデンとして引用しているのを見ますが、マクファデンは1-logLik(model)/ logLik(null_model)として定義されていたと考えています。 、他のモデルは対象外です)。それでそれは受け入れられた名前を持っていますか?
Tom Wenseleers、

これは確かにマクファーデンの疑似だと確信していますR2。あなたが言うように、ロジスティック回帰の場合、これはMcFaddenの統計に単純化されます。
ベン-モニカを

元のリファレンスであるcore.ac.uk/download/pdf/6448852.pdf eqn 57を調べたところ、問題は、McFaddenがLL(saturated_model)がゼロであった1つの特定のGLMモデルに対してのみこのR2を定義したことです。したがって、彼が一般的なケースに対してそれをどのように定義したかを推測することしかできないと思います...また、books.google.be /…やDescToolsのPseudoR2、SAS、およびStataで指定されているこの単純な正しくない式によっても出力
Tom Wenseleers

したがって、マクファデン自身が与えた公式ではないため、おそらく別の名前を付ける必要があります。多分それを「一般化されたマクファデン」またはそのようなものと呼ぶことができますか?
Tom Wenseleers

おそらく、ただし、より広いバージョンを使用したとしても、特定のケースのみを発明/発見した人にちなんでコンセプトに名前が付けられるのは、これが初めてではないでしょう。「一般化された」部分は不要だと思います。マクファデン係数と呼ぶのが妥当でしょう。
ベン-モニカを

2

なぜSSE + SSRはSSTと等しくなければならないのですか?たまたま、線形モデルがそうでした。それが続くべきであることを示すための多くの方法がありますy=Xβ+εガウスマルコフ条件下で。ただし、通常は保持する必要はありません。負担は、それが成り立つことを証明することであり、それが成り立たないことではありません


2
それはの直交性の下で保持する必要があります (YiYi^) そして (Yi^Y¯)(回帰と残差)ベクトル。仕切ることができます(YiY¯)2((YiYi^)+(Yi^Y¯))2=(YiYi^)2+(Yi^Y¯)2+2(YiYi^)(Yi^Y¯)。2つが直交している場合、上記の3番目の合計はベクトルの内積であるため、ゼロに等しくなるはずです。
グレッグ、

@Greg、直交性自体は派生プロパティであり、回帰仮定の一部ではありません
-Aksakal

2次元の場合を考えるとよいでしょう。2次元空間にベクトルAとBがあるとします。これは、SSTotalおよびSSRと同等です。SSEは、SStotalとSSRの差、または(A-B)です。これらの3つのベクトルは三角形を形成します。
グレッグ、

ベクトルAを一定に保ち、(A-B)が最小化されるようにBを選択しているとします(したがって最小二乗)。次に、|| A-B || Bの長さがBへのAの投影に等しい場合、最小化されます。この場合、Bと(A-B)は直交します。Bがこの投影よりも長いか短い場合は、定数を掛けてそれを変更できます。したがって、SSRがSSEに直交していない場合、最小二乗ベクトルではありません。この推論をn次元のベクトル空間やサイズのデータ​​セットに拡張できない理由はわかりません。
グレッグ、

投影は線形の概念です
Aksakal

1

他の理由により、R-squaredは依然として非線形モデルの欠陥のある測定値である可能性がありますが、SSR + SSE = SSTotalの関係が、特定の非線形関数、特に多項式モデルなどの定数項を可能にします。この結論は、提供されたncbiリンクから読んだ内容を含め、このディスカッションに投稿された内容と互換性があると思いますが、完全なレポートにはアクセスできませんでした。

一連の適合値がある場合 y^ 一連の観察に関して y、 どこ y^ =+fバツ= Y¯ +Y¯ +fバツ 定数項であり、 fバツ 予測子変数の関数。 Y^Y¯ に直交していません YY^、フィットされた値の新しいセットを作成できます Z そのような Z=cY^Y¯+Y¯、ここでc = ΣY^Y¯YY^/ΣY^Y¯2。新しいフィット値Z、ベクトル ZY¯ 誤差ベクトルとこの新しい誤差ベクトルに直交します YZ 元の平方和よりも小さい平方和になります YY^。のZ 元の推定モデルに定数を掛けて cそして、複数の観測値の平均を追加します。これは、定数項を持つモデルと互換性があります。したがって、これらの状況では、最小二乗モデルは常に直交回帰と誤差ベクトルを持つ必要があります。つまり、SSE+SSR=SSTotal

作業中の少数のデータセットに多項式モデルを作成しましたが、この関係はそれらすべてと関係しています。私は言っているだけです。


0

R2非線形回帰では限定的に使用されます。GraphPad Prismで利用できるようにしますが、次の1つの方法でのみ使用することをお勧めします。

見る R2一連の実験を実行し、今日の実験が他の実験と一致していることを確認したい場合。たとえば、常にR2 0.90から0.95の間ですが、今日は R2= 0.75の場合、疑わしいことに注意し、その特定の実験で使用されたメソッドや試薬に問題があったかどうかを注意深く確認してください。そして、新入社員があなたに結果を示したらR2 同じシステムを使用して0.99の場合、削除された「外れ値」の数と、一部のデータが構成されているかどうかを注意深く確認する必要があります。

もっと

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.