Andrew Ngの機械学習コースでは、次の式を使用しています。
そして彼は以下に示される簡単な証明をします:
証拠はコメントなしで非常に密に見え、私はそれを理解するのに苦労しています。2番目から3番目の平等から具体的に何が起こりましたか?
Andrew Ngの機械学習コースでは、次の式を使用しています。
そして彼は以下に示される簡単な証明をします:
証拠はコメントなしで非常に密に見え、私はそれを理解するのに苦労しています。2番目から3番目の平等から具体的に何が起こりましたか?
回答:
手順の多くを混乱させる、この表記法の微妙ではあるが激しい乱用があります。行列の乗算、転置、トレース、導関数の定義に戻って、この問題に対処しましょう。説明を省略したい場合は、最後のセクション「すべてをまとめる」にジャンプして、厳密なデモンストレーションがどれほど短くてシンプルであるかを確認してください。
発現のためのメイクセンスにある行列、(正方形)でなければならない行列及びでなければならない商品はそこから、行列行列。トレース(対角要素の合計である)を取るために、次にとし、を正方行列にします。A m × n B n × n C m × p m × p Tr (X )= ∑ i X i i p = m C
表記 " "は、に関する式の導関数を参照しているようです。通常、微分は関数実行される演算です。点の導関数は、線形変換です。これらのベクトル空間のベースを選択すると、そのような変換は行列として表すことができます。 ここではそうではありません! A F :R N → R M、X ∈ R N D F (X ):R N → R M M × N
代わりに、は要素と見なされ。その係数は、長さベクトルに展開されます(通常、行ごとまたは列ごと)。関数は、場合、実際の値を持ちます。したがって、は行列でなければなりません。これは、線形形式を表す行ベクトルです。ただし、問題の計算では線形形式を表す別の方法を使用します。それらの係数は行列にロールバックされます。RのM nは N = M N F (A )= Trの(A B A ' C )M = 1 DのF (X )1 × M N R M 、N、M × N
してみましょう一定であること行列。次に、トレースと行列乗算の定義により、M × N
これは、の係数の最も一般的な線形結合を表します。はと同じ形状の行列で、行目と列目のその係数は、線形結合の係数です。なぜなら、の役割及び同等の発現を与え、切り替えてもよいですω A I J A I J ω I J A I J = A I J ω I J ω A
マトリックス定数を同定することによってとのいずれかの機能のまたは、我々は表してもよい直鎖状空間上のフォームとして行列の行列。 (これらをからまでの関数の導関数と混同しないでください!)A → Trの(ω ')A → Trと(ω A ')M × N個のM × N R、N R M
統計で見られる行列関数の多くの導関数は、定義から最も簡単かつ確実に計算されます。行列の微分の複雑なルールに頼る必要はありません。この定義は、次のような線形変換が存在する場合に限り、がで微分可能であることを示しています。x L
任意の小さな変位。リトルOH表記は、差をで近似する際に生じる誤差が、十分に小さいのサイズよりも任意に小さいことを意味します。特に、比例するエラーは常に無視されます。 F (X + H )- 、F (X )Lの時間時間H | h | 2
問題の関数に定義を適用しましょう。2つのの積を持つ用語を乗算、拡張、および無視し、
導関数を特定するには、これを形式に変換する必要があります。右側の最初の項はすでにこの形式で、です。右の他の用語は、フォーム有する用。これを書きましょう:
呼び出すと、は書き換え可能
それはであるこの私たちはの派生検討することができるという意味でであることをこれらの行列が遊ぶためにトレース式におけるの役割。
これが完全なソリューションです。
ましょであり、行列行列、及び行列。ましょう。ましょうあること任意の小さな係数を有するマトリックス。なぜなら(identityによって)は微分可能であり、その導関数は、行列によって決定される線形形式
これは約半分の作業で済み、行列とトレースの最も基本的な操作(乗算と転置)のみを伴うため、結果のより簡単な、そしておそらくより目立つ-デモと見なす必要があります。元のデモの個々のステップを本当に理解したい場合は、ここに示した計算と比較することは有益だと思うかもしれません。