関係が線形か非線形かを確認する統計的検定


9

次のようなデータセットの例があります。

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

ここに画像の説明を入力してください

この図から、ある範囲の「ボリューム」と「パワー」の間の関係は線形であり、「ボリューム」が比較的小さくなると、関係は非線形になることが示唆されます。これを説明するための統計的検定はありますか?

OPへの応答に示されているいくつかの推奨事項に関して:

ここに示されている例は単なる例であり、私が持っているデータセットは、ここで見られる関係に似ていますが、騒々しいです。これまでに行った分析では、特定の液体の体積を分析すると、体積が小さいと信号のパワーが大幅に増加することを示しています。つまり、ボリュームが15から20の間の環境しかなかったとしましょう。それは、ほぼ線形の関係のように見えます。ただし、ポイントの範囲を増やす、つまりボリュームを小さくすると、関係がまったく線形にならないことがわかります。これを統計的に示す方法に関する統計的なアドバイスを探しています。これが理にかなっているといいのですが。


5
ここでいくつかのことが起こっています。まず、もちろん、変数の範囲が適切に制限されていれば、関係は線形に見えます。第2に、データの不均一性は、非線形関係と同じくらい顕著な特徴です。散布は、ボリュームが大きく、パワーが小さい場合よりもボリュームが大きく、パワーが小さい場合のほうが大きくなります。とにかく、正確に何をテストしたいですか?全範囲にわたる関係の線形性は?
whuber

4
実際、私は異分散性についての見解を取り戻したいと思います。プロットはそのような外観を与えますが、それは、低ボリュームでの比較的急な勾配によって引き起こされる幻想です。(しかし、パワーの面でのボリュームは、非常に不均一な関係にあります。)パワーの変動が均一であると判断すると、これは、ある種の分析を除外し(パワーの非線形変換を適用したくない)、提案します。非線形性が明確に確立されたら、他のもの(非線形最小二乗法や一般化線形モデルなど)を優先します。
whuber

ここで問題の簡単な説明を追加しました。これまでのコメントに感謝します。これらは本当にありがたい問題であり、問​​題を考えるのに役立ちます。
KatyB 2013

なぜ二次効果をテストしないのですか?
AdamO 2013

2
@Simon私はすべてのテストを使用していないが、それにもかかわらず、あなたがすることができます参照して、これはボリュームに対する残差の典型的な大きさをプロットすることにより等分散であること。次にRコードを示しますplot(s <- by(cbind(Power, Volume), groups <- cut(Volume, 10), function(d) summary(lm(Power ~ Volume, data=d))$sigma), xlab="Volume range", ylab="Residual SD", ylim=c(0, max(s))); abline(h=mean(s), lty=2, col="Blue")。全範囲にわたってほぼ一定の残差サイズを示しています。
whuber

回答:


4

これは基本的にモデル選択の問題です。物理的にもっともらしいモデルのセット(線形、指数、不連続な線形関係)を選択することをお勧めします。赤池情報量基準またはベイジアン情報量基準を使用して、@ whuberが指摘する異分散性の問題に留意して、最良のものを選択します。


2

これをググってみましたか!?これを行う1つの方法は、より高い出力またはその他の非線形項をモデルに適合させ、それらの係数が0と大きく異なるかどうかをテストすることです。

ここにいくつかの例がありますhttp://www.albany.edu/~po467/EPI553/Fall_2006/regression_assumptions.pdf

ケースでは、データセットを2つのセクションに分割して、ボリューム<5の非線形性とボリューム> 5の線形性をテストすることができます。

もう1つの問題は、データが不均一であり、回帰データの正規性の仮定に違反することです。提供されているリンクは、このテストの例も示しています。


リンクが壊れています。
ジャティン2017年

2

非線形回帰を使用して、1つのモデルをすべてのデータに適合させることをお勧めします。任意のボリュームを選択し、1つのモデルをそれよりも小さいボリュームにフィッティングし、別のモデルをより大きなボリュームにフィッティングするポイントは何ですか?図の外観以外に、5を鋭いしきい値として使用する理由はありますか?特定のボリュームしきい値の後、理想的な曲線は線形であると本当に信じていますか?音量が上がるにつれて水平に近づく可能性は高いですが、決して線形ではありませんか?

もちろん、分析ツールの選択は、回答しようとしている科学的質問とシステムに関する事前の知識に依存する必要があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.