Rが負の場合


77

私の理解では、は乗なので負にはなり得ません。しかし、単一の独立変数と従属変数を使用してSPSSで単純な線形回帰を実行しました。私のSPSS出力は、負の値を与えます。Rから手動でこれを計算する場合、は正になります。これを負として計算するためにSPSSは何をしましたか?R 2 R 2R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

私が使用したコード:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

負の値を取得します。誰もこれが何を意味するのか説明できますか?

負のRS二乗

ここに画像の説明を入力してください


3
これはあなたの質問に答えますか?stats.stackexchange.com/questions/6181/… そうでない場合は、詳細情報を提供してください。これは、どの手順の「SPSS出力」ですか?
whuber

2
線形回帰モデルには切片がありますか?
NPE

2
@Anne繰り返しますが
whuber

1
@Anneデータが時系列ではなく、時系列手順を使用していないため、時系列の応答を無視することをお勧めします。Rの2乗が負の値として与えられていると本当に確信していますか?その大きさは正しいです:。おそらく慣例として負のRのR 2乗値が否定されるかどうかをSPSSヘルプで調べましたが、これが事実であるという証拠は見当たりません。おそらく、R-squaredを読んでいる出力のスクリーンショットを投稿できますか?(0.395)2=0.156
whuber

1
従属変数は住宅の価格であるため、95%CIが120,000になる可能性があります。残念ながら、データの使用条件に反するため、ここにデータを投稿することはできません。
アン

回答:


106

R 2 R 2 R 2R2は、選択したモデルの適合度を水平直線の適合度と比較します(帰無仮説)。選択したモデルが水平線よりもうまく適合しない場合、は負になります。その注意常に何の正方形ではないので、それは数学のいずれかのルールに違反することなく、負の値を持つことができます。は、選択したモデルがデータの傾向に従っていない場合にのみ負になるため、水平線よりも適合度が低くなります。R2R2R2

例:切片が等しくなるように制約された線形回帰モデルにデータを適合させます。1500Y1500

ここに画像の説明を入力してください

これらのデータを考えると、モデルはまったく意味をなしません。おそらく誤って選択された、明らかに間違ったモデルです。

モデルの適合(点(0,1500)を通過するように制約された直線)は、水平線の適合よりも劣ります。したがって、モデルからの平方和は水平線からの平方和よりも大きくなり。はとして計算され。場合よりも大きい、その式は負の値演算。S S totR 2 1 S S reg(SSreg)(SStot)R2 SSregSStotR21SSregSStotSSregSStotR2

制約のない線形回帰では、は正(またはゼロ)でなければならず、相関係数二乗に等しくなければなりません。負のは、切片または勾配のいずれかが制約され、「最適な」線(制約が与えられた場合)が水平線よりも適合しない場合にのみ線形回帰で可能です。非線形回帰では、最適なモデル(選択した方程式とその制約がある場合)が水平線よりも悪いデータに適合する場合、は負になる可能性があります。 r R 2 R 2R2rR2R2

結論:負のは、数学的な不可能性やコンピューターのバグの兆候ではありません。これは、選択したモデル(とその制約)がデータに非常にうまく適合しないことを意味します。R2


3
@JMSそれは私のグーグルが示すものの反対です:「/ ORIGIN」は0で切片を修正します。「/ NOORIGIN」「定数を抑制しないようにSPSSに伝えます」(Windows用SPSS入門ガイド
whuber

10
@whuber正しい。@ harvey-motulsky負のR ^ 2値、通常のOLS回帰(インターセプトあり)では数学的に不可能です(コンピューターのバグを示唆します)。これは、「REGRESSION」コマンドが行うことであり、元のポスターが求めていることです。また、OLS回帰の場合、R ^ 2 予測値と観測値の間の二乗相関です。したがって、非負でなければなりません。1つの予測変数を使用した単純なOLS回帰の場合、これは予測変数と従属変数の間の相関の二乗に相当します。これも非負でなければなりません。
ウルフギャング

1
@whuber確かに。私の悪い; 明らかに私はSPSSを使用していません-または、どうやら読んでいるようです:)
JMS

1
@whuber。線形回帰では、R2が切片(または傾斜)が制約されている場合にのみ負になる可能性があることを指摘する段落を追加しました。制約がない場合、R2は正でなければならず、相関係数rの2乗に等しくなければなりません。
ハーヴェイモトゥルスキー

1
@HarveyMotulsky、この場合、切片または勾配は制約されませんでした。Rsquaredは、これらが制約されている場合にのみ負になる可能性があると言っているようです。この特定のケースで何が起こったのか詳しく説明していただけますか?
アン

18

回帰にインターセプトを含めるのを忘れましたか?私はSPSSコードに精通していませんが、林の計量経済学の21ページで:

回帰変数に定数が含まれていないが(一部の回帰ソフトウェアパッケージに含まれているように)、それでも計算する場合R2

R2=1i=1nei2i=1n(yiy¯)2

R2

SPSSが回帰にインターセプトを含めていることを確認します。


4
彼女のコードのNOORIGINサブコマンドは、インターセプトがモデルに含まれていたことを示しています
-ttnphns

2
それは変だ。これはNOORIGIN、インターセプトがモデルに含まれておらず、名前から外れていることを意味すると推測していました。
マットオブライエン

6

これは、Niidの時系列があり、ドリフトなしの最初の差分ランダムウォークモデルであるform(0,1,0)の不適切なARIMAモデルを構築し、分散(平方和-SSE)する場合に発生する可能性があります残差は、元の系列の分散(平方和SSO)よりも大きくなります。したがって、方程式1-SSE / SSOは、SSEがSSSOを実行すると負の数を生成します。ユーザーが想定されたモデルに単純に適合するか、不適切な手順を使用して適切なARIMA構造を特定/形成するときに、これを見てきました。大きなメッセージは、モデルがあなたの視力を歪める可能性があるということです(悪いメガネのペアのように)。データにアクセスできなければ、間違った結果を説明するのに問題が生じます。これをIBMの注意を引きましたか?

想定モデルが非生産的であるという考えは、ハーベイ・モツルスキーによって反響されました。素晴らしい投稿ハーヴェイ!


1
stat。ありがとう。いいえ、私はIBMと話をしていません。データは時系列ではありません。ある時点のデータからです。
アン

5
@Anneその他:データは時系列ではなく、時系列手順を使用していないため、私の答えは無視してください。時系列に関与しているときに負のR二乗を観測した他の人は、私の投稿が興味深く接線的に有益であると感じるかもしれません。他の人は残念ながらそうではないかもしれません。
IrishStat

@IrishStat:Harvey Motulskyの投稿へのリンクを追加してください。
kjetil bハルヴォルセン

ハーベイはここで質問に答えました。
IrishStat
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.