線形回帰の可能性


7

単純な線形回帰の可能性を人々がどのように導き出すかを理解しようとしています。1つの特徴xと結果yだけがあるとしましょう。私はないではない通常の密度自体で式を疑う私も疑問1が原因独立にシンプルな要因に製品を因数分解できることをしないでください。人々がこの表現をどのように導き出したのか疑問です。入力およびほぼすべての場所について(部分的に正しくない)仮定の全体の動物園があり、実際に正しい仮定を使用する必要がある重要なステップ(通常の密度の積を導出する方法)は省略されています:-(

私は仮定のが自然だと思うことは以下の通りである。我々は、固定されたトレーニングセット与えられていると仮定します(xi,yi)i=1,2,...,n

  1. 長さ固定トレーニングセット内のペアは、iid分散されたランダム変数からのもの(xi,yi)n(Xi,Yi)
  2. Yi=β0Xi+ϵi
  3. ϵi各として分散一次元IIDランダム変数でN(0,σ)σ(簡単にするために)知られている(多分1条件濃度約ものと仮定すべきであるfϵi|Xiここ?人々は実際にここで何を仮定するべきか不確かに思われる...)

レッツとlet。目標は、条件付き密度です。明らかに、 Y=(Y1,...,Yn)X=(X1,...,Xn)fY|X=f(Y,X)fX

fY|X=i=1nfYi|Xi

質問:

ここから先に進むには?

仮定がまたはに関する情報をどのように与えるかわかりませんそのため、この量を単純に計算できません。また、一部の人々は、および正規分布している(または正規分布している)とは、も正規分布していると考えているかもしれませんが、...f(Yi,Xi)fXifYi|Xi=f(Yi,Xi)fXiYi=β0Xi+ϵiϵiϵi|XiYi|X

正規分布のランダム変数に関するステートメントがありますが、次のようになりますが正規分布で、が固定行列の場合、は通常再分布されます。上記の場合、はであり、定数行列ではありませんXA,BAX+BBβ0Xi

他の情報源は、は通常すぐに配布されると想定しているようです。これは奇妙な仮定のようです...実際のデータセットでそれをどのようにテストできるでしょうか?fYi|Xi

よろしくお願いいたします。

FW


設定に問題があります。たとえば、「iid分散されているランダム変数」という文は通常正しくありません。少なくともは通常異なる手段を持っているので、これらの理由だけでiidではありません。(Xi,Yi)Xi
Aksakal

共同配布については何も想定していないと主張していますが、(2)と(3)で明らかにそれについて非常に強力な想定を行っています。
whuber

@whuber:問題は、線形回帰が適切なモデルであるかどうかではありません... SVMを計算する場合でも、分布に対して暗黙的に非常に強力な仮定を行います...でも式。問題は次のとおりです。線形回帰が優れたモデルである場合、パラメーターを計算するために実際に式を作成するにはどうすればよいですか:-)
Fabian Werner

@Aksakal:私はあなたが何を話しているのか理解していません、すみません...これはかなり哲学的な議論のようです:は同じ意味を持ち、機械学習のほとんどすべての設定で同じように分布しています。「同じ意味ではない」とはどういう意味ですか?Xi
Fabian Werner

@Aksakal:例:ランダムに選択された一連の人々において、固定された個人の年齢は他の個人の年齢に依存しますか?同じ家族のメンバーを選択する可能性は低いので、ほとんどありません...
Fabian Werner

回答:


3

導出する重要な仮定 fYi|Xi ノイズは入力から独立している、つまり ϵi から独立しています Xi。あなたはの分布について何かを知っている、または仮定する必要はありませんXi

あなたは次から始めます:

fY|バツバツy=pY=y|バツ=バツ=pβ0バツ+ε=y|バツ=バツ=pε=yβ0バツ|バツ=バツ

ここで、独立性の仮定が使用されます。 ε から独立しています バツ、次の値が与えられた場合の密度 バツ 単にその密度です:

p(ϵi=yβ0x|Xi=x)=p(ϵi=yβ0x)=...e(yβ0x)2/2σ2

あるいは、条件付きでのノイズの分布は、Xi の値が与えられた場合、一定の分散(および平均0)で正常 Xi。これは本当に重要なことです。しかし、これは通常の仮定と厳密に同等です。

  • ϵi 独立しています Xi
  • ϵi 正規分布している(平均0で)

非常に良い答え、ありがとう!!! しかし、私はまだ次のことに苦労しています:どのようにそれを結論付けますかp(ϵ=yβ0X|X=x)=p(ϵ=yβ0x|X=x)、つまり、密度の設定での確率変数の条件付け(条件付き期待値などではない)が、具体的な値での置き換えに過ぎないと思いますか?
Fabian Werner

イベントの単純な条件付き確率を直接処理するので、離散変数を使用すると見やすくなります。 P(Y=f(X)|X=x)=P(Y=f(X) and X=x)/P(X=x)。最後に、イベント(セット)として、(Y=f(X) and X=x)=(Y=f(x) and X=x)。それは単なる論理です。同じ考えが密度にも当てはまります。
Benoit Sanchez

最後に、はい、それは交換のように機能します。
Benoit Sanchez

2

ブノワ・サンチェスの答えのおかげで、私はようやく理解しました(ただし、条件付き密度の置換ルールの間違ったパスに引っ掛かりました)。答えは次のとおりです。

人はそれを仮定する必要があります

  1. ペア (xi,yi) 確率変数から来る (Xi,Yi) そのような変数 Zi=(Xi,Yi) 独立している
  2. Yi=β0Xi+ϵi
  3. ϵi iidです。 N(0,σ) 配布された
  4. ϵi から独立しています Xi (エラーは機能によって上下しませんが、それとは無関係です)
  5. X=(X1,...,Xn) そして Y=(Y1,...,Yn) 共通の密度を持っている fX,Y。特に、すべての(Xi,Yi) 共通の密度を持っている fXi,Yi

次の簡単な観察が必要です。 n 実数値確率変数 Z1,...,Zn 共通の密度で fZ1,...,Zn そして全単射 Φ:RnRn そのような Φ そして Φ1 次に区別可能です

fΦ(Z1,...,Zn)(z1,...,zn)=|det(Φ1)|fZ1,...,Zn(Φ1(z1,...,zn))
つまり、変換された確率変数の密度は、変換されたポイントで評価された古い密度です。

重要な観察は、2次元の確率変数 (Yi,Xi) の単純な変換です (ϵi,Xi)、すなわち

(Yi,Xi)=Φ(ϵi,Xi)
どこ Φ(e,x)=(e+β0x,x)。我々は持っていますΦ1(y,x)=(yβ0x,x)。その微分行列は
Φ1=(1β001)
これは決定的なものです。

この状況に観察を適用して、

fYi,Xi(y,x)=fΦ(ϵi,Xi)(y,x)=1fϵi,Xi(Φ1(y,x))=fϵi,Xi(yβ0x,x)

ϵi から独立しています Xi 仮定により、したがって

fYi,Xi(y,x)=fϵi(yβ0x)fX(x)
というより
fYi|Xi(y|x)=fϵi(yβ0x)fX(x)fX(x)=fϵi(yβ0x)
そしてこれから(そしてから fY,X=ifYi,Xi 独立性の仮定により)通常の尤度方程式を得る。

私は今幸せです :-)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.