線形回帰のドロップアウト


9

私はドロップアウトに関する元の論文(https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf)を読んでおり、線形回帰のセクションでは、次のように述べられています。

ERBernoulli(p)[y (RX)w2]

次のように減少します:

ypXw2+p(1p)Γw2

彼らがこの結果にたどり着いた方法を理解できません。誰か助けてもらえますか?


ここでとは何ですか?Γ
Laconic

3
:私はこのトピックに関する長編のエッセイを書いたmadrury.github.io/jekyll/update/statistics/2017/08/12/...
マシュードゥルーリー

回答:


7

まず、便宜上、します。損失を拡大すると、 期待WRTの撮影我々がいる 行列の期待値はセル単位の期待値の行列なので、 so 最後の項では、 したがって もしならRX=M

yMw2=yTy2wTMTy+wTMTMw.
R
ER(yMw2)=yTy2wT(EM)Ty+wTE(MTM)w.
(ERM)ij=ER((RX)ij)=XijER(Rij)=pXij
2wT(EM)Ty=2pwTXTy.
(MTM)ij=k=1NMkiMkj=k=1NRkiRkjXkiXkj
(ERMTM)ij=k=1NER(RkiRkj)XkiXkj.
ij次に、それらは独立しているため、非対角要素はます。対角要素には、 p2(XTX)ij
k=1NER(Rki2)Xki2=p(XTX)ii.

これを終えると、 あり、が見つかりました で、私は結果がので、すべての非対角要素がゼロであることを示し この論文では、定義しているため、は、完了しました。

ypXw2=yTy2pwTXTy+p2wTXTXw
ERyMw2=yTy2pwTXTy+wTER(MTM)w=ypXw2p2wTXTXw+wTER(MTM)w=ypXw2+wT(ER(MTM)p2XTX)w.
ER(MTM)p2XTX
ER(MTM)p2XTX=p(1p)diag(XTX).
Γ=diag(XTX)1/2Γw2=wTdiag(XTX)w

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.