2つの変数のログ間に線形関係があるという直感的な意味は何ですか?


20

私は2つの変数を持っていますが、お互いにそのままプロットするとあまり相関がありませんが、各変数のログをプロットすると非常に明確な線形関係があります。

そのため、次のタイプのモデルになります。

log(Y)=alog(X)+b
、数学的には素晴らしいが、通常の線形モデルの説明的な値を持たないようです。

そのようなモデルをどのように解釈できますか?


5
既存の回答に追加する実質的なものはありませんが、結果と予測子の対数は弾力性です。その用語を検索すると、その関係を解釈するための優れたリソースが見つかりますが、これはあまり直感的ではありません。
Upper_Case-Stop Harming Monica

従属変数は、ログ(Y)と独立変数であり、対数モデルの解釈は、ログ(X)である:。%Δ=β1%Δx
ボブ

3
補完的なログ-ログリンクは、結果がバイナリ(リスクモデル)であり、性的パートナーの数とHIV感染などの露出が累積的な場合に理想的なGLM仕様です。jstor.org/stable/2532454
AdamO

2
@Alexisでは、曲線をオーバーレイすると、スティッキーポイントを見ることができます。試してみてくださいcurve(exp(-exp(x)), from=-5, to=5)curve(plogis(x), from=-5, to=5)。凹面が加速します。単一のエンカウンターからのイベントのリスクがpである場合、2番目のイベント後のリスクは1(1p)2などである必要があります。これは確率論的な形状ロジットではキャプチャされません。露出度が高いと、ロジスティック回帰の結果がより劇的に歪められます(事前の確率ルールに従って誤って)。いくつかのシミュレーションはこれを示します。
AdamO

1
@AdamO 3つの中から特定の二分法の結果リンクを選択する方法を動機付けるようなシミュレーションを組み込んだ教育学的論文がおそらくあるでしょう。
アレクシス

回答:


27

方程式の両側の指数をとるだけで、潜在的な関係が得られます。これは、一部のデータにとって意味があります。

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

また、は任意の正の値を取ることができる単なるパラメーターであるため、このモデルは次と同等です。eb

Y=cXa

モデル式にはエラー項を含める必要があり、変数のこれらの変更はそれに興味深い効果があることに注意してください。

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

つまり、OLSの条件を順守する加法誤差(一定の分散をもつ正規分布誤差)をもつモデルは、対数が一定の分散をもつ正規分布に従う乗法誤差をもつ潜在的なモデルと同等です。


3
OPは、このディストリビューションにlog-normalという名前があることを知りたい場合があります。en.wikipedia.org
wiki

2
ジェンセンの不平等の影響はどうですか?略凸状gで、E[g(X)]g(E[X])
統計

14

モデルlog(Y)=alog(X)+bを取得し、合計差分を計算すると、次のような結果になります

1YdY=a1XdX
d dYに 帰着する X dX
dYdXXY=a

したがって、係数の単純な解釈aのパーセント変化であろうYのパーセント変化をX。これはさらに、変数YXの成長率の一定の割合a)で成長することを意味します。X


では、log-logプロットが線形の場合、それは一定の成長率を意味しますか?
Dimitriy V. Masterov

実際には、の成長率は、a = 0の場合にのみ一定です。Ya=0
RScrlli

時間ではなく、xの成長に対する成長率。
Dimitriy V. Masterov

順序変更は役に立たないので削除します
Aksakal

1
@ DimitriyV.Masterov OK、それから対数X で線形なので、変数YXの成長率の一定の割合で成長することを意味します。あなたによると私の答えに何か問題がありますか?log(Y)log(X)YX
RScrlli

7

logは直観的に変数の大きさオーダーを提供するため、2つの変数の大きさのオーダーは線形に関連しているため、関係を見ることができます。たとえば、予測子を1桁増加させると、応答が3桁増加する場合があります。

対数対数プロットを使用してプロットする場合、線形関係が見られます。この質問の例を使用して、線形モデルの仮定を確認できます。

log-log


3
+1を使用すると、直感的でない概念に対する直感的な回答が得られます。ただし、含めた画像は、予測子全体の一定の誤差分散に明らかに違反しています。
フランスロデンブルク

1
答えは正しいが、著者の帰属は間違っている。画像はGoogle画像に起因するものではなく、少なくとも、Google画像をクリックするだけで見つけることができるWebページに起因するものである必要があります。
ペレ

@Pere画像の元のソースを残念ながら見つけることができません(少なくとも逆方向の画像検索を使用)
qwr

最初はdiagrams.usから来ているようですが、そのサイトはダウンしており、そのページのほとんどはホームページを
Henry

4

@Rscrillによる回答と実際の離散データとの調整、検討

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

しかし

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1Yt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

したがって、我々は得る

gYtagXt

これは、実証研究で@Rscrillの理論的取り扱いを検証します。


1
これはおそらく数学者が直観と呼ぶものでしょう:)
リチャード・ハーディ

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.