GLMの「リンク機能」と「正規リンク機能」の違いは何ですか


65

「リンク関数」と「標準リンク関数」という用語の違いは何ですか?また、一方を他方より使用する(理論的な)利点はありますか?

たとえば、バイナリ応答変数は、logitprobitなどの多くのリンク関数を使用してモデル化できます。ただし、ここでのロジットは「標準的な」リンク関数と見なされます。


10
ここでは、リンク関数について詳しく説明します。ロジットモデルとプロビットモデルの違い。バイナリ応答変数の回帰に焦点を当てています。その議論のほんの一部がリンク関数が「標準的」であることの意味に焦点を合わせていますが、それでも読むのに役立つかもしれません。正規リンク関数と非正規リンク関数の違いb / tと利点を理解するには、GLiMの基礎となる数学をかなり深く掘り下げる必要があることに注意してください。
GUNG -モニカ元に戻し

回答:


68

上記の答えはより直感的であるため、より厳密に努めています。

GLMとは何ですか?

ましょう応答の組示し、Y及びP次元共変量ベクトルX = X 1... XはP期待値とE Y = μを。用I = 1 ... n個の独立した観測値は、それぞれの分布のY iは濃度の指数ファミリーである F Y IY=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyi ここで、関心(天然またはカノニカルパラメータ)のパラメータである θ iが φがありますスケールパラメーター(既知または迷惑と見なされる)および γ τは既知の関数です。pの固定入力値の n次元ベクトル

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnp説明変数は示されます。我々は、入力(1)のみ線形関数を介して、線形予測、影響力ベクトルと仮定 η I = β 0 + β 1 X I 1 + + β P X I P その上にθ iは異なり。示されているように、θ = γ 1μ x1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ)、この依存関係は、平均を介して線形予測子θを接続することによって確立されます。より具体的には、平均μは線形予測子の可逆で滑らかな関数、つまりg μ = η または μ = g 1η と見なされ ます。ηθμ
g(μ)=η or μ=g1(η)

g()μηθηθg=(γ)1

Xyixijyij=1,,pμ

したがって、デフォルトで使用される傾向があります。ただし、モデル内の効果が、このリンクまたは他のリンクによって与えられるスケールで加算的である必要があるという先験的な理由はないことに注意してください。


5
+1、これは本当に良い答えです、@ Momo。いくつかの方程式が段落に埋もれていると読みにくいことがわかったので、二重ドル記号(つまり$ $)を使用してそれらを「ブロック」しました。私はそれがOKであることを願っています(そうでない場合、あなたは私の謝罪なしでロールバックできます)。
GUNG -モニカ元に戻し

1
ただし、元の質問の@Momoには、Weiが質問した内容が含まれているため、まだ明確に回答されていないことを指摘する価値があります。
Glen_b 14

1
θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)

1
γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθη正規リンク関数を使用する場合にのみ存在します。
Druss2k

2
μθηθ

16

gungは良い説明を引用しました:正規リンクは最小限の十分性の特別な理論的特性を持っています。つまり、結果の数を条件として条件付きロジットモデル(エコノミストは固定効果モデルと呼びます)を定義できますが、プロビットリンクで使用する十分な統計がないため、条件付きプロビットモデルを定義できません。


最低限の十分性について少し詳しく説明していただけますか?上記の説明によって、プロビットモデルを定義できますか?確かに正規リンク関数ではありませんが、非正規リンク関数を使用することの害は何ですか。
ピカチュカメレオン

9

以下に、MITの18.650クラスからヒントを得た小さな図を示します。これは、これらの機能間の関係を視覚化するのに役立つため、非常に便利です。@momoの投稿と同じ表記を使用しました。

ここに画像の説明を入力してください

  • γ(θ)
  • g(μ)

g

この図を使用すると、たとえば、ある方向から別の方向に簡単に移動できます。

η=g(γ(θ))
θ=γ1(g1(η))

正規リンク機能

g

γ1g1=(gγ)1=I
θ=η

1

上記の答えは、私が言いたいことをすでにカバーしています。機械学習の研究者としてのいくつかのポイントを明確にするために:

  1. リンク関数は、アクティベーション関数の逆に他なりません。たとえば、ロジットはシグモイドの逆数であり、プロビットはガウスの累積分布関数の逆数です。

  2. wTxwx

上記の議論は指数関数的な家族とは何の関係もありませんが、素晴らしい議論はクリストファー・ビショップのPRML本の第4.3.6章にあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.