線形モデルと線形回帰の違い


8

線形回帰と線形モデルの違いに興味があります。私の理解では、線形回帰は線形モデルのより大きなファミリの一部ですが、両方の用語が同義語としてよく使用されます。さて、線形回帰を実行するときに満たす必要がある仮定をバイパスするために、回帰分析を線形モデルに置き換えることができると私は提案しました。トピックに関する読書の提案があれば、それらは大歓迎です。

私が何をしているのかを理解する手助けをしてほしい

  • 線形回帰であり、そのように扱う必要があります
  • 「線形モデル」に置き換えることができます
  • 私の方法は「線形モデル」と同義です

だから、ここでは私が略してやったことです。分析の目的は、散布図に線をプロットすることでした。データセットの分析には、x軸とラインの勾配と交点の両方が使用されます。結果変数は化学元素の割合(時間あたりの濃度)であり、予測子は2つの濃度の比率(したがって単位なし)でした。1つのプロットで比較する必要があるさまざまな環境(深度)でレートを測定しました。深さの1つだけが回帰の仮定に適合しません。

  1. Rでlm関数を使用して線形方程式を計算しました。
  2. lmオブジェクトの残差を確認しました。
  3. 残差が正規分布でも分散も等しくないことを発見しました。
  4. 結果の変量(レート)の対数変換により分散が修正されると考えましたが、残差はまだ正規分布していませんでした。
  5. 方程式から外れ値によるバイアスが少なくなるようにロバストな方法を使用することにしました。これは分析から除外できません(関数lmrob、パッケージrobustbase)。
  6. 対数変換のため、線をプロットしませんでした。対数変換する必要のない他のデータがプロットにありますが、問題を引き起こしているデータセットに匹敵するはずです。また、元のプロットは複数のプロットデザインの一部であり、すでに広範囲に及ぶため、プロットを対数スケールで拡大することもできません。

多分私の目的のために、回帰の仮定は興味がありませんか?今はどうしようか悩んでいるのでよろしくお願いします!


2
関連する質問はこちら
Richard Hardy

お手元の問題についてもう少しお話しいただけますか。データの性質(特に、必ずしも肯定的なもの)。対数変換が予測子または結果変数に対して行われたかどうか。「対数変換のために線をプロットできない」理由。
EdM 2016年

@リチャードハーディ:コメントありがとうございます。でも、私の場合はどうすればよいかわかりません。
シラフィナ2016年

@EdM:もう少し具体的になるようにして質問を編集しました。私の問題はより一般的なものだと思うので、詳細については追加しませんでした。うまくいけば、編集は質問へのコメントの助けになります。
シラフィナ2016年

@シラフィナ、私はあなたの質問への答えを知りません。私のコメントは、多少関連のあるスレッドを指し示しただけです。
Richard Hardy

回答:


2

1つの深さからのデータを除いて、ほとんどのデータが単純な線形回帰に適しているという当面の問題を解決する最も簡単な方法は、モデル自体の問題をモデル結果の表示の問題から分離することです。変数の変換を必要とする1つの深さについては、プロットする前に、回帰の適合を元のスケールに逆変換します。その1つの深度には、他の深度を特徴付ける直線ではなく曲線がありますが、有用なx切片が必要です。その切片の近くの曲線の勾配は、深度間の勾配の比較の開始点になります。

ただし、この特定の深度が他の深度とは異なるプロパティを持つように見える理由を考慮する必要があります。それはおそらく他の深度と比べて(温度、混合などに関して)何らかのタイプの境界を超えた深度値の極端ですか?それとも、その特定の深度での測定に体系的な誤差があっただけかもしれません。その場合、それらをまったく考慮すべきではありませんか?このような科学的および技術的問題は、統計的アプローチの詳細よりもはるかに重要です。

あなたの質問で提起されたより広範な問題については、線形モデルの基礎となる仮定は、このサイト、たとえばここで広く議論されています。予測変数に関する結果の線形性は重要ですが、エラーの正規分布のような他の仮定は主にp値を解釈する能力に影響します。予測子変数に関して線形性がある場合でも、回帰は基礎となる関係の有用な推定を提供します。一般化線形モデルは、予測値の関数であるエラーに対処する手段を提供します。

予測変数の値にエラーがあると考えられるため、実験計画が、異なる深度で測定された化学物質の濃度に基づく観察研究である場合、標準線形回帰の仮定の1つにすでに違反していることに注意してください。その場合、実際に持っているのは変数エラーモデルです。実際には、その区別は見過ごされがちですが、回帰モデル(および制御された研究ではなく観察研究に従事するほとんどの科学者のモデル)は、厳密な線形回帰の仮定にすでに違反しています。

最後に、すでに多くのデータ分析を行っていることを感謝しますが、本当に濃度を使用する必要があるかどうかを検討してください予測変数として。比率は、特に分母が0に近くなる可能性がある場合に、厄介なことで悪名高いです。比率を使用して予測子として達成できるほとんどすべてのことは、分子と分母の変数の対数変換で行うことができます。私はあなたの状況を理解しているように、単一の結果変数(一部の化学物質の生産率)と他の化学物質の複数の測定濃度があります。次に、結果変数の予測子として、これらの他の化学物質のさまざまな比率を調べました。代わりに、他のすべての化学物質の対数濃度を結果の予測子として使用する複合回帰モデルを作成した場合、化学物質間の予期しない相互作用を示し、なお用語で解釈できる、より有用なモデルになる可能性があります。必要に応じて比率の。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.