ニューラルネットワークとグラフィカルモデルを数学的に結びつけるのに苦労しています。
グラフィカルモデルでは、アイデアは単純です。確率分布はグラフのクリークに従って因数分解され、ポテンシャルは通常指数関数的ファミリーです。
ニューラルネットワークに同等の推論はありますか?制限付きボルツマンマシンまたはCNNのユニット(変数)の確率分布を、それらのエネルギー、またはユニット間のエネルギーの積の関数として表現できますか?
また、確率分布は、指数ファミリーのRBMまたはディープビリーフネットワーク(CNNなど)によってモデル化されていますか?
ジョーダン&ウェインライトがグラフィカルモデル、指数ファミリ、変分推論を使用してグラフィカルモデルに対して行ったのと同じ方法で、これらの最新タイプのニューラルネットワークと統計の間の接続を形式化するテキストを見つけたいと思っています。どんなポインタでも素晴らしいでしょう。
"using deep nets as factors in an MRF"
)ではなく、ディープネットを確率論的因子グラフとして見る方法についての詳細です。Yann LeCunが言うとき"of course deep Boltzmann Machines are a form of probabilistic factor graph themselves"
、私はその関係を数学的に見ることに興味があります。
https://distill.pub/2017/feature-visualization/
(ニューラルネットワークが画像の理解を構築する方法)などの隠れ層コンポーネント情報ストレージのいくつかの形式を見てきました。複雑な画像には、隠れ層ノードによって表されるコンポーネントオブジェクトがあります。重みは、離散的ではない方法で「トポロジ」を「変更」できます。見たことはありませんが、一部の方法では、エッジを削除して元のトポロジを変更するための収縮係数を含めることができます