機械学習におけるエネルギー最小化とは何ですか?


14

私はコンピュータービジョンの不適切な問題の最適化について読んでいて、Wikipediaでの最適化に関する以下の説明に出会いました。私が理解していないのは、コンピュータービジョンでこの最適化を「エネルギー最小化」と呼ぶのはなぜですか?

最適化の問題は、次の方法で表すことができます。

指定:関数集合から実数へのf:ARA

求め:要素におけるようにすべてのためにおける ( "最小化")、またはそのすべてのためにおけるA ( "最大化") 。x0Af(x0)f(x)xAf(x0)f(x)xA

このような定式化は、最適化問題または数学的プログラミング問題(コンピュータープログラミングに直接関係しないが、たとえば線形プログラミングでまだ使用されている用語-以下の履歴を参照)と呼ばれます。この一般的なフレームワークでは、現実世界および理論上の多くの問題をモデル化できます。物理学およびコンピュータービジョンの分野でこの手法を使用して定式化された問題は、モデル化されているシステムのエネルギーを表す関数fの値といえば、手法をエネルギー最小化と呼ぶ場合がありますf

回答:


7

エネルギーベースのモデルは、多くの機械学習アルゴリズムを表現するための統一されたフレームワークです。彼らは推論をエネルギー関数を最小化し、学習を損失関数を最小化すると解釈します。

エネルギー関数は、潜在変数の構成と、例で提供される入力の構成の関数です。通常、推論とは、低エネルギー構成を見つけること、または特定の構成を選択する確率がギブス分布になるように、可能な構成からサンプリングすることを意味します。

損失汎関数は、多くの例が与えられたモデルパラメーターの関数です。たとえば、教師あり学習問題では、損失はターゲットでの合計エラーです。モデルを構成する(パラメーター化された)関数の関数であるため、「関数型」と呼ばれることもあります。

主な論文:

Y. LeCun、S。Chopra、R。Hadsell、M。Ranzato、およびFJ Huang、「エネルギーベースの学習に関するチュートリアル」、構造データの予測、MIT Press、2006年。

参照:

LeCun、Y。、およびHuang、FJ(2005)。エネルギーベースのモデルの識別トレーニングのための損失関数。第10回人工知能と統計に関する国際ワークショップ(AIStats'05)の議事録。http://yann.lecun.com/exdb/publis/pdf/lecun-huang-05.pdfから取得

Ranzato、M.、Boureau、Y.-L.、Chopra、S.、&LeCun、Y.(2007)。教師なし学習のための統合エネルギーベースのフレームワーク。手続き AIと統計に関する会議(AI-Stats)。http://dblp.uni-trier.de/db/journals/jmlr/jmlrp2.html#RanzatoBCL07から取得


3
「推論をエネルギー関数を最小化し、学習を損失関数を最小化すると解釈する」という意味を拡張できますか?エネルギー関数は損失関数とどう違うのですか?
クリフAB

あなたの答えを詳しく説明してください
-iamprem

@CliffABうまくいけば、それはより明確ですか?
ニールG

@NeilG:正直なところ、私はまだ少し混乱しています。私には、「エネルギー関数」は基本的に統計の尤度関数と同じように聞こえます。それは合理的な解釈ですか、それとももっと微妙なものが欠けていますか?
クリフAB

@CliffAB:エネルギー関数は対数尤度である場合があり、その場合、総指数化エネルギーは1です。ただし、その必要はありません。非確率的エネルギーベースのモデルは、この正規化について心配しません。これにより、確率的モデルよりも効率的に学習できます。これは、構成スペースで高価な積分を評価することを避けるためです。
ニールG

2

信号検出文献では、信号のエネルギーは、xtのように定義される

E=Σxt2

一部の機能は、xから何らかの応答yを予測するときに、進行することは非常に一般的かつ簡単な方法は、二乗誤差の和最小化することである

SSE=Σ(yy^)2
yが嵌合応答です。類似性に注目してください。SSEはエネルギーです。このエネルギーは、適合パラメーターによって最小化されます。y^


1
損失とエネルギーを混同していると思います
ニールG

私は信号処理からのエネルギーの標準的な定義を使用しています。コンピュータサイエンス/機械学習の人々は用語を再定義する傾向があると思います。私は統計と信号処理のバックグラウンドから来ました
スタン

最初の式はエネルギー関数です。2番目の式は、構成の関数ではないため、損失関数です。
ニールG

@Neilあなたが引用した論文で定義されている用語を正しく使用していると確信しています。これは、私が
スタン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.