ガウシアンプロセスモデルの主な利点


11

ガウス過程は、特にエミュレーションで広く使用されています。計算需要が高いことが知られています()。0(n3)

  1. 何が彼らを人気にしていますか?
  2. それらの主な隠れた利点は何ですか?
  3. なぜそれらがパラメトリックモデルの代わりに使用されるのですか(パラメトリックモデルとは、異なるパラメトリックフォームを使用して、入力対出力の傾向を記述するために使用できる典型的な線形回帰を意味します。

ガウス過程をユニークで有利にする固有の特性を説明する技術的な答えに本当に感謝します


パラメトリックモデルの意味を明確にできますか?
Alexey Zaytsev

@Alexey上記のパラメトリックモデルの意味を明確にしました。ありがとう
Wis 2016

パラメトリックモデルについて私が想定していることから、問題ごとに手動でモデルを指定する必要があります。本当の性質が常に知られているわけではないので、これは常に可能であるとは限りません。さらに、これらのモデルのフィッティングには困難が伴う可能性がありますが、ガウシアンプロセスの場合、パラメーター推定はほぼ常にうまく機能します。
Alexey Zaytsev

4
スプラインと線形回帰は、適切な共分散関数が選択されたガウスプロセス回帰と同等です。しかし、ガウシアンプロセスは、多くのタスクに適した便利な確率的フレームワークを提供します。
Alexey Zaytsev

1
ガウス過程を使用しないのはいつですか?
アルビー2017

回答:


6

主な利点は、エンジニアリングの観点からです(@Alexeyが言及)。広く使用されているクリギング手順では、距離と方向に応じて関係の「相関」(または共分散)モデル(通常はバリオグラム楕円体)を提供することにより、独自の「空間」を解釈できます。

他の方法論が同じ機能を持つことを妨げるものは何もありません。クリギングが最初に概念化された方法が、統計学者ではない人々に対して友好的なアプローチを持っていたことが偶然に起こりました。

今日、とりわけ逐次ガウスシミュレーションなどの地理統計学ベースの確率論的方法論の台頭により、これらの手順は不確実性空間(数千から数百万の次元をとることができる)を定義することが重要なセクターで使用されています。繰り返しになりますが、エンジニアリングの観点から見ると、地球統計学に基づくアルゴリズムは、遺伝的プログラミングに組み込むのが非常に簡単です。そのため、逆問題がある場合、複数のシナリオをテストし、最適化関数への適応性をテストできるようにする必要があります。

純粋な議論を少しの間、この使用の現代の実際の例のための事実の状態のままにしておきましょう。地下のサンプルを直接サンプリングするか(ハードデータ)、または地下の地震マップを作成できます(ソフトデータ)。

ハードデータでは、エラーなしでプロパティ(音響インピーダンスとしましょう)を直接測定できます。問題は、これが不足している(そして高価である)ことです。一方、地震マッピングは文字通り地下のピクセル単位のボリュームマップですが、音響インピーダンスは与えられません。簡単にするために、音響インピーダンスの2つの値(上部と下部)の間の比率を提供するとします。したがって、0.5の比率は1000/2000または10 000/20 000の除算になる可能性があります。これは複数のソリューションスペースであり、いくつかの組み合わせで機能しますが、現実を正確に表すのは1つだけです。これをどのように解決しますか?

地震インバージョンが機能する方法(確率的手順)は、音響インピーダンス(または他のプロパティ)のもっともらしい(これはすべて別の話です)シナリオを作成し、それらのシナリオを合成地震(前の例の比率のような)に変換し、合成地震と実際の地震を比較します(相関)。最良のシナリオは、さらに多くのシナリオを作成するために使用され、ソリューションに収束します(これは見た目ほど簡単ではありません)。

これを考慮して、ユーザビリティの観点から話すと、次のようにあなたの質問に答えます。

1) それらを人気にしたのは、使いやすさ、実装の柔軟性、いくつかの異なる分野(特に地球科学、GISを含む)のための新しく適応性のあるガウスベースの手順を作成し続ける多数の研究センターと機関です。

2) 主な利点は、前述したように、私の観点からは使いやすさと柔軟性です。操作が簡単で使いやすい場合は、それを実行してください。ガウス過程には、他の方法論(統計など)では再現できない特定の機能はありません。

3) データよりも多くの情報をモデルに含める必要がある場合に使用されます(そのような情報には、空間的な関係、統計的分布などがあります...)。クリギングを使用して等方性の振る舞いを持つ多くのデータがある場合、時間の浪費であることを保証できます。他の方法を使用しても、必要な情報が少ないため実行速度が速く、同じ結果を得ることができます。


そして、いつ他のモデルがより良い選択でしょうか?
ベン

1
@ベンそれは常にケーススタディに依存します。クリギング、またはクリギングベースの方法は、計算コストが高くなります(高速ではありません)。たとえば、最近の4k(またはそれ以上)のテレビは、補間法を使用して、より小さな解像度向けに作成されたコンテンツを試し、改善しています。これは、この操作をユーザーの介入なしに高速に実行する必要があることを意味します(共分散モデルで必要になります)。この特定の問題を解決するのであれば、クリギングを完全に回避します。また、いくつかの現象は、パターン等...、ベース、または離散変数を有する、または(例えば、FEM)式にすることができるされている
armatita

そして、速度が重要でないときは?
ベン

結果が即時である必要がない場合、@ Ben Speedはそれほど重要ではありません。GISサイエンス内の地下モデリング、天気予報、および一連の操作は、ほんの数例です。もう1つは、回答で提示されたものです(地震インバージョン)。
armatita

聞き取れませんでした。計算速度も結果速度も重要ではありませんが、GPの欠点は何ですか?あるいは言い換えれば、もっと頻繁に使われるべきではないでしょうか?
Ben

7

エンジニアにとっては重要です:

  • 予測の信頼区間がある
  • トレーニングデータを補間する
  • 滑らかで非線形のモデルを持っている
  • 実験の最適化設計と最適化のために、取得した回帰モデルを使用する

ガウスプロセスは、これらすべての要件を満たします。

さらに、エンジニアリングおよび地球統計学のデータセットはそれほど大きくないか、特定のグリッド構造を持っているため、高速な推論が可能です。


1
コメントありがとう。それはそれらのベイズの解釈のためにガウス過程モデルは良い不確実性の定量化を持つことができるようですが、これはパラメトリック回帰でも可能です。一連の統計上の利点を説明できる技術的なアプローチを探しています
Wis

3

ガウスモデルの利点。

ガウスPDFは、1次モーメントと2次モーメントにのみ依存します。広義の定常的なガウス過程は、厳密な意味の定常過程でもあり、逆もまた同様です。

ガウスPDFは、いくつかの重要なクラスの信号とノイズを含む多くのプロセスの分布をモデル化できます。多くの独立したランダムプロセスの合計は、ガウス分布(中心極限定理)を持ちます。

非ガウス過程は、適切な平均と分散のいくつかのガウス確率密度関数の重み付き組み合わせ(つまり、混合)で近似できます。

ガウスモデルに基づく最適な推定方法は、多くの場合、線形で数学的に扱いやすい解になります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.