の値を使用して、重回帰分析で線形性の仮定をテストするにはどうすればよいですか?


13

以下のグラフは、「正常性」、「同相性」、「独立性」の仮定が確実に満たされている回帰テストの残差散布図です。「線形性」の仮定をテストする場合、グラフを見ると関係が曲線であると推測できますが、問題は次のとおりです。「R2線形」の値を使用して線形性の仮定をテストできますか?関係が線形であるかどうかを判断するための「R2 Linear」の値の許容範囲はどのくらいですか?線形性の仮定が満たされておらず、IVの変換も役に立たない場合はどうすればよいですか?!!

テストの全結果へのリンクはこちらです。

散布図:

ここに画像の説明を入力してください

ここに画像の説明を入力してください

ここに画像の説明を入力してください


3
グラフの外観から、SPSSを使用していることがわかります。グラフを開いて編集し、[フィット線の追加]ボタンを見つけると、Lossなどの非線形線描画オプションが見つかります。このオプションが合理的に直線を提供するかどうかを確認します。
ttnphns

@ ttnphns:Loess line 2の質問にプロットを追加しました。
サイラス

まあ、それは非常に曲線的に見えますよね?Loessパラメーターをさらに使用して、何が起こるかを確認できます。線が湾曲している場合、関係は線形ではないと視覚的に結論付けることができます。
ttnphns

@Cyrus、この質問への一般的な答えを投稿しましたが、プロットに少し解釈を追加するつもりで、軸とy軸がプロットに何があるのか​​よくわかりません-明確にできますか?xy
マクロ

@ ttnphns:うん、それは曲線です。このモデルの扱い方がわかりません!このテスト(#2)では、DV(PIT)に直接影響するIVが2つあります。回帰結果は、DVに有意に影響するIVは1つだけであることを示しました。R2は非常に低く(0.172)、直線性も低くなっています(少なくともグラフによれば、IVが低レベルのとき)。このテストが受け入れられるかどうかはわかりません!両方のIVを(LNを計算して)変換し、回帰を再実行しましたが、結果はさらに悪化しました!
サイラス

回答:


15

YiXiR2

R2XY

  • R2

  • R2

それぞれについて順に説明します。

R2X1,...,Xn99%M1%

Yi={Ziif XiMMif Xi=M

ZiN(μ,1)Mμμ=0,M=105XiYi

u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1

YiXiYiXiXi=M

R2XiYi

Yi=β0+β1Xi+εi

YiXiXivar(εi)=σ2β1R2

x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698

R2

Re:直線性の仮定が満たされておらず、IVの変換も役に立たない場合はどうすればいいですか?!!

非線形性が問題になる場合、残差対各予測変数のプロットを見ると役立つ場合があります-顕著なパターンがある場合、これはその予測変数の非線形性を示します。たとえば、このプロットが残差と予測子の間の「ボウル型」の関係を明らかにする場合、これはその予測子に二次項がないことを示している可能性があります。他のパターンは、異なる機能形態を示している場合があります。場合によっては、正しい変換を試みていないか、変数の変換されたバージョンでは真のモデルが線形ではない可能性があります(ただし、合理的な近似を見つけることは可能です)。

あなたの例について:R2


4

R2=11R2R221<x<2R2R2


マイケルに感謝します。私のサンプルサイズは302です。ここでテストの結果を見て、報告するのが妥当であり、受け入れられるかどうかを確認できれば幸いです。TQ
サイラス

@Cyrusこれは難しいものです。残差は正常に非常によく似ているように見え、線形回帰で間違っていることはわかりません。十分な量のデータがあります。ランダムノイズ成分が大きいため、R squareは低くなります。LOESSプロットは、独立変数の低い値での曲率を示しています。しかし、私はその説得力を見つけられません。私はそれが線形である可能性があり、この場合R平方が良い指標ではない理由を示していると思う。
マイケルR.チャーニック

Tq Michael :)はい、本当に困惑しています!すべての仮定は完全に満たされていますが、直線性です!上記の最初のグラフでわかるように、2次R2(0.199)は線形R2(0.172)よりも大きいため、モデルをより適切に予測できます。実際に(SC2を追加して)二次回帰を行ったとき、結果の散布図は非常に不均一でした!私は困惑している!このモデルをどうするかわからない!唯一の問題は、直線性が低いことです。レポートに散布図を配置する場合、線形性を正当化する方法がわかりません。2次回帰も2等質性の仮定を満たしません。ヘルプ
サイラス

1
困惑しているとは思わない。かなり直線的に見えます。R平方が低いのは、多くのばらつきがあるためです。変動を減らす唯一の方法は、他の説明変数を見つけることだと思います。
マイケルR.チャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.