勾配ベースの最適化と遺伝的アルゴリズムの組み合わせを使用して対数事後のグローバル最大値を見つけることにより、MAP推定を確実に実行できる高次元推論問題(約2000モデルのパラメーター)に取り組んでいます。
MAP推定値を見つけることに加えて、モデルパラメーターの不確実性をある程度推定できるようになりたいです。
パラメータに関して対数事後の勾配を効率的に計算できるため、長期的にはハミルトニアンMCMCを使用してサンプリングを行うことを目指していますが、今のところ、非サンプリングベースの推定に興味があります。
私だけが知っているアプローチ我々は計算してもいるので、多変量正規として後方に近似するモードで、ヘッセ行列の逆行列を計算し、それでもこれは、このような大規模なシステムのために実現不可能と思われることですの要素をHessianその逆を見つけることができなかったと確信しています。
このような場合に一般的にどのようなアプローチが使用されているかを誰かが提案できますか?
ありがとう!
編集 -問題に関する追加情報
背景
これは、大規模な物理学実験に関連する逆問題です。いくつかの物理フィールドを記述する2D三角形メッシュがあり、モデルパラメーターは、メッシュの各頂点におけるそれらのフィールドの物理値です。メッシュには約650個の頂点があり、3つのフィールドをモデル化するため、2000個のモデルパラメーターがそこから取得されます。
私たちの実験データは、これらのフィールドを直接測定しない機器からのものですが、フィールドの複雑な非線形関数である量です。さまざまな機器のそれぞれについて、モデルパラメータを実験データの予測にマップするフォワードモデルがあり、予測と測定の比較により対数尤度が得られます。
次に、これらすべての異なる計測器からの対数尤度を合計し、フィールドにいくつかの物理的制約を適用するいくつかの対数優先値を追加します。
したがって、この「モデル」がカテゴリにきちんと分類されるかどうかは疑問です。モデルを選択することはできません。実験データを収集する実際の機器がどのように機能するかによって決まります。
データセット
データセットは500x500の画像で構成され、カメラごとに1つの画像があるため、合計データポイントは500x500x4 = です。
エラーモデル
問題のすべてのエラーを現時点でガウス分布と見なします。ある時点で、柔軟性を高めるためにスチューデントtエラーモデルに移行しようとするかもしれませんが、ガウシアンだけでも問題なく機能するようです。
可能性の例
これはプラズマ物理実験であり、私たちのデータの大部分は、レンズの前に特定のフィルターを備えたプラズマに向けられたカメラから得られ、光スペクトルの特定の部分のみを見ています。
データを再現するには、2つのステップがあります。最初に、メッシュ上のプラズマからの光をモデル化する必要があります。次に、その光をモデル化してカメラ画像に戻す必要があります。
残念ながら、プラズマからの光のモデル化は、実効レート係数とは何かに依存します。これは、フィールドが与えられたさまざまなプロセスによって放出される光の量を示します。これらのレートはいくつかの高価な数値モデルによって予測されるため、それらの出力をグリッドに保存し、値を検索するために補間する必要があります。レート関数データは一度だけ計算されます-データを保存してから、コードの起動時にそこからスプラインを作成し、そのスプラインをすべての関数評価に使用します。
仮定する及び(我々は補間によって評価する)速度関数、で次に排出されている「番目頂点メッシュのによって与えられ、
エラーはガウスであるため、この特定のカメラの対数尤度は
ここで、はカメラデータです。合計の対数尤度は上記の式の4つの合計ですが、カメラが異なる場合、光スペクトルの異なる部分を見ているため、レート関数バージョンがすべて異なります。
以前の例
さまざまな量に特定の上限と下限を効果的に設定するさまざまな事前分布がありますが、これらは問題に対してあまり強く作用しない傾向があります。強く作用する1つの事前分布があります。これは、フィールドにラプラシアンタイプの平滑化を効果的に適用します。また、ガウス形式を取ります: