線形回帰モデルと非線形回帰モデルの違いを見分ける方法は?


27

私は、非線形回帰SAS Non Linearに関する次のリンクを読んでいました。最初のセクション「非線形回帰と線形回帰」を読んで理解したことは、以下の式は実際には線形回帰であるということでした。それは正しいですか?もしそうなら、なぜですか?

y=b1x3+b2x2+b3x+c

非線形回帰では多重共線性は問題ではないことも理解できますか?私は、多重共線性が線形回帰の問題になる可能性があることを知っていますので、確かに上記のモデルが実際に線形回帰であれば、多重共線性があるでしょうか?



回答:


35

回帰を「線形」と見なすことができる(少なくとも)3つの感覚があります。 それらを区別するために、非常に一般的な回帰モデルから始めましょう

Y=f(X,θ,ε).

議論を簡単にするために、独立変数を固定して正確に測定します(ランダム変数ではなく)。それらは、それぞれp属性のn個の観測をモデル化し、応答Yのnベクトルを生成します。従来、Xn × p行列、Yは列nベクトルとして表されます。(有限のqベクトル)θパラメーターで構成されますεはベクトル値のランダム変数です。通常はnXnpnYXn×pYnqθεnコンポーネントが、時には少ないです。関数はベクトル値(Yに一致するn個のコンポーネント)であり、通常、最後の2つの引数(θおよびε)が連続していると見なされます。fnYθε

ラインをデータに適合させる典型的な例は、Xが数値のベクトルx i(x,y)X --the x値。Yは、 n個の数値y i)の並列ベクトルです。θ = α β は、切片 αと勾配 βを提供します。そして ε = ε 1ε 2... ε N(xi,i=1,2,,n)Yn(yi)θ=(α,β)αβε=(ε1,ε2,,εn)は、その成分が独立している(通常、平均ゼロの同一であるが未知の分布を持っていると想定される)「ランダムエラー」のベクトルです。前の表記では、

yi=α+βxi+εi=f(X,θ,ε)i

θ=(α,β)

回帰関数は、3つの引数のいずれか(またはすべて)で線形になります。

  • 「線形回帰、又は『線形モデルは、』通常ことを意味の関数として線形であるパラメータがθの意味SAS 『非線形回帰』が付け加え仮定し、この意味であり、fは 2番目の引数で微分可能です(パラメータ):この仮定により、解決策を見つけやすくなります。f θf

  • Yの間の線形関係」は、fXの関数として線形であることを意味します。XYfX

  • fεで線形である場合、モデルには付加誤差があります。そのような場合、Eε = 0常に仮定されます。(そうでなければ、εを「エラー」または「正しい」値からの「偏差」と考えるのは正しくありません。)fεE(ε)=0ε

これらの特性のあらゆる可能な組み合わせが発生し、有用です。 可能性を調査しましょう。

  1. 加法的誤差を伴う線形関係の線形モデル。 これは通常の(多重)回帰であり、既に上記で示されており、より一般的には

    Y=Xθ+ε.

    は、必要に応じて、定数の列に隣接することにより拡張され、 θ pベクトルです。Xθp

  2. 加法的誤差を伴う非線形関係の線形モデル。 これは、の列にX自体の非線形関数を追加することにより、重回帰として扱うことができます。例えば、XX

    yi=α+βxi2+ε

    この形式です。線形です。相加的エラーがあります。また、x 2 ix iの非線形関数であるにもかかわらず、値1 x 2 iは線形です。θ=(α,β)(1,xi2)xi2xi

  3. 非加法的エラーを伴う線形関係の線形モデル。 例は乗法エラーです。

    yi=(α+βxi)εi.

    (そのような場合にはの位置「乗法誤差」として解釈することができるε iはある1ただし、場所の適切なセンスが期待必ずしもない。Eは、ε Iもう:それは、中央値、またはかもしれません例えば、幾何平均。場所の仮定に関する同様のコメントは、必要な変更を加えて、他のすべての非加法的エラーのコンテキストにも適用されますεiεi1E(εi)

  4. 非加法性エラーを伴う非線形関係の線形モデル。 例えば

    y=α+βバツ2ε
  5. 加法的誤差を伴う線形関係の非線形モデル。 非線形モデルには、非線形であるだけでなく、パラメーターを再表現しても線形化できないパラメーターの組み合わせが含まれます。

    • 非たとえば、考えます

      y=αβ+β2バツ+ε

      定義することによって、及びβ ' = β 2、及び規制β '0を、このモデルを書き換えることができます。α=αββ=β2β0

      y=α+βバツ+ε

      線形モデル(加法誤差との線形関係)としてそれを示す。

    • たとえば、考えます

      y=α+α2バツ+ε

      新しいパラメータ見つけることは不可能であるに応じて、αの機能としてこれを線形化することを、α "(線形でそれを維持しながら、X I良くとして)。αααバツ

  6. 加算誤差を伴う非線形関係の非線形モデル。

    y=α+α2バツ2+ε
  7. 非加法的誤差を伴う線形関係の非線形モデル。

    y=α+α2バツε
  8. 非加法的誤差を伴う非線形関係の非線形モデル。

    y=α+α2バツ2ε

これらは8つの異なる回帰形式を示しますが、一部の形式は他の形式に変換できるため、分類システムを構成しません。標準的な例は、非加算的エラーを伴う線形モデルの変換です(積極的なサポートがあると仮定)

y=α+βバツε

対数を介して添加エラーの非線形な関係の線形モデルに、

ログy=μ+ログα+βバツ+ログεμ

ここでは、ログ幾何平均の誤差項から削除されました(彼らは必要に応じて、ゼロの手段を持っていることを確認するため)、その値を推定する必要があります他の用語(に組み込ま)。確かに、従属変数Yを再表現する主な理由の1つは、加法誤差のあるモデルを作成することです。再式は、パラメーターと説明変数のいずれか(または両方)の関数としてYを線形化することもできます。μ=EログεYY


共線性

の列ベクトルの)共線性は、あらゆる形式の回帰で問題になる可能性があります。これを理解する鍵は、共線性がパラメーターの推定に困難をもたらすことを認識することです。抽象的かつ非常に一般的に、2つのモデルY = f X θ ε Y = f X θ ε )を比較します。ここで、X は1列がわずかに変更されたXです。これにより推定値が大幅に変化する場合バツY=fバツθεY=fバツθεバツバツ θ "、そして、明らかに我々は問題を抱えています。この問題が発生する可能性のある1つの方法は、Xで線形の線形モデル(つまり、上記のタイプ(1)または(5))で、θの成分がXの列と1対1で対応する場合です。。1つの列が他の列の非自明な線形結合である場合、対応するパラメーターの推定値は、実数である可能性があります。それはそのような感度の極端な例です。θ^θ^バツθバツ

この観点から、共線性は非線形関係の線形モデルの潜在的な問題であり(エラーの加法性に関係なく)、共線性のこの一般化された概念はあらゆる回帰モデルの問題である可能性があることは明らかです。冗長変数がある場合、一部のパラメーターの識別に問題が発生します。


あなたが言及した線形化をよりよく理解するのに役立つ簡潔で入門的な読書をお勧めしますか?
ColorStatistics

@Color私はどれにも慣れていません。可能な変換の微分可能性に関する穏やかな仮定の下で、これは偏微分方程式(PDE)の理論によって対処されます。
whuber

0

現実とそれを説明するために使用しているモデルとの違いを作ることから、今すぐ始めるべきです

あなたが今言及した方程式は、多項方程式(x ^ power)です。非線形...しかし、パラメーターは線形(b1、b2、b3、c)であるため、一般化線形モデル(リンク関数を使用)またはポリノメール回帰を使用してモデル化できます

助けたことを願って、それは実際には少し大ざっぱです:現実/モデル


3
モデルはパラメータが線形であるため、これは通常の最小二乗法で推定できます。
アナリスト

だから、すべてはパラメータに関係していますか?b3 ^ 2 * xの場合、それはまだ線形でしょうか?
mHelpMe

0

パラメーターが線形であるか、パラメーターが線形になるように変換できる場合(線形化可能)、モデルは線形です。線形モデルは、線形または非線形の関係をモデル化できます。これらのそれぞれについて拡大しましょう。

用語の合計として記述できる場合、モデルはパラメーターが線形です。ここで、各用語は定数または予測子(X i)を乗算するパラメーターです。

ここに画像の説明を入力してください

この定義は非常に狭いことに注意してください。この定義を満たすモデルのみが線形です。他のすべてのモデルは非線形です。

非線形モデルと混同される2つのタイプの線形モデルがあります。

1.非線形関係の線形モデル

たとえば、以下のモデルは、非線形関係をモデル化します(X 1に対するYの導関数はX 1の関数であるため)。W新しい変数を作成することによって、1 = X 1 2、およびWと方程式再書き込み1は、 Xの交換1 2を、私たちは、線形モデルの満たす定義その方程式を持っています。

ここに画像の説明を入力してください

2.すぐに線形ではないが、変換後に線形になるモデル(線形化可能)。以下は、線形化可能なモデルの2つの例です。

例1:

ここに画像の説明を入力してください

このモデルは、パラメーターが線形であるモデルの定義を満たさないため、非線形に見える場合がありますが、線形モデルに変換できるため、線形化可能/変換可能線形であり、したがって線形であると見なされますモデル。次の変換はそれを線形化します。両側の自然対数を取得することから始めます。

ここに画像の説明を入力してください

その後、次の置換を行います。

ここに画像の説明を入力してください

以下の線形モデルを取得するには:

ここに画像の説明を入力してください

例2:

ここに画像の説明を入力してください

このモデルは、パラメーターが線形であるモデルの定義を満たさないため、非線形に見える場合がありますが、線形モデルに変換できるため、線形化可能/変換可能線形であり、したがって線形であると見なされますモデル。次の変換はそれを線形化します。両側の逆数を取得して開始します。

ここに画像の説明を入力してください

その後、次の置換を行います。

ここに画像の説明を入力してください

以下の線形モデルを取得するには:

ここに画像の説明を入力してください

線形ではない(線形化を介しても)モデルはすべて非線形です。このように考えてください:モデルが線形モデルの定義を満たさない場合、それは線形モデルであることが証明できる場合を除き、非線形モデルです。その時点で、モデルは線形モデルと呼ばれる権利を獲得します。

上記のWhuberの回答とこのリンクのGlen_bの回答は、私の回答に色を追加します。 非線形モデルと一般化線形モデル:ロジスティック、ポアソンなどの回帰をどのように参照しますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.