クリギングするときにバリオグラムモデルを提供する必要があるのはなぜですか?


9

空間統計とチュートリアルをたくさん見て、

しかし、私があなたがクリゲするときにバリオグラムモデルを提供しなければならない理由は本当にわかりません。

私はRでgstatパッケージを使用していますが、これは彼らが与える例です:

library(sp)
data(meuse)
coordinates(meuse) = ~x+y
data(meuse.grid)
str(meuse.grid)
gridded(meuse.grid) = ~x+y
m <- vgm(.59, "Sph", 874, .04)
print(m)
# ordinary kriging:
x <- krige(log(zinc)~1, meuse, meuse.grid, model = m)

最初にvgmを指定する必要がある理由を数行で説明できる人はいますか?そして、どのようにパラメータを設定しますか?

前もって感謝します!キャスパー


以下のために簡単なクリギング推定量は平均と空間共分散は、事前に知られている場合にのみBLUEです。では通常のクリギング 1のデータからバリオグラムを推定し、その後、補間を行います。同じムーズデータのRパッケージのビネットをgstat参照してください。
アンディW

アンディさん、コメントありがとうございます。バリオグラムモデルがなくてもクリゲできることはビネットでわかりました。私は次のことを行いました:krige(residuals〜1、temp_plot_spatial、y、nmin = 5、nmax = 10)なので、最小5つのネイバーと最大10を調べるだけでkrigeは意味がありますか?結果は、種類の素敵なのでした:dropbox.com/s/7lxvfiyfl7ekhb4/...
カスパー

バリオグラムのモデリングに問題があると思います。相関関係が距離とは関係なく、最も近い近傍と関係があると仮定するとどうなるでしょうか。
Kasper

「相関関係が距離とは関係なく、最も近い隣人と関係があると仮定するとどうなるでしょうか?」-それはクリギングではない、それはknn分類とよりインラインです。コードkrige(residuals~1 ,temp_plot_spatial, y, nmin=5, nmax=10)は局所バリオグラムを推定します。たとえば、スタディスペース全体にバリオグラムはありませんが、予測しようとしている場所ごとに新しいモデルを推定します。ローカルモデルは、最も近い10個の値のみを取得します(最大距離を指定しないため、常に10個の値を取得するnmin必要があるため、不必要です)。
アンディW

1
次に、局所バリオグラムを推定することは論理的なことです。モデル内の他の予測子を含む特定の機能に応じて変化する場合もオプションです。IDWは、最も単純なタイプのクリギングモデルと見なされる可能性があります。したがって、IDWは、データからバリオグラムを実際に推定することよりも優れているべきではありません。
アンディW

回答:


9

はじめにとまとめ

トブラーの地理の法則が主張する

すべては他のすべてと関連していますが、近いものは遠いものよりも関連しています。

クリギングは、これらの関係のモデルを採用しています

  • 「もの」は、地球の表面(または空間)上の位置の数値であり、通常はユークリッド平面として表されます。

  • これらの数値は、確率変数の実現であると想定されます。

  • 「関連」は、これらの確率変数の平均と共分散の観点から表現されます。

(空間内のポイントに関連付けられたランダム変数のコレクションは、「確率過程」と呼ばれます。)バリオグラムは、それらの共分散を計算するために必要な情報を提供します。

クリギングとは

具体的には、クリギングは、観測されていない場所での事物の予測です。予測プロセスを数学的に扱いやすくするために、クリギングは可能な式を観測値の線形関数に制限します。これにより、問題は係数がどうあるべきかを決定する有限の問題になります。これらは、予測手順に特定のプロパティがあることを要求することで見つけることができます。直感的に、優れた特性は、予測子と真の(ただし未知の)値の差が小さくなる傾向があることです。つまり、予測子は正確でなければなりません。強く宣伝されているが、さらに疑わしいもう1つの特性は、平均して予測子が真の値と等しくなければならないことです。つまり、正確でなければなりません。

(完全な正確さを主張することが疑わしい理由ですが、必ずしも悪いわけではありません)は、通常、それによって統計的手順の精度が低下するためです。縁があり、めったに中心にぶつからないか、または中心のすぐ隣にあるが、厳密には中心ではない結果を受け入れますか?前者は正確ですが不正確ですが、後者は不正確ですが正確です。)

これらの仮定と基準-つまり、平均と共分散は、関連性を定量化する適切な方法であり、線形予測が機能し、予測子は完全に正確であることを条件として、可能な限り正確でなければならないことです。共分散が一貫した方法で指定されていれば、独自のソリューション。結果の予測子は、それによって「BLUP」と呼ばれます:最良の線形不偏予測子。

バリオグラムの出所

これらの方程式を見つけるには、今説明したプログラムを操作可能にする必要があります。これは、予測子と確率変数と考えられる観測値との間の共分散を書き留めることによって行われます。共分散代数により、観測値間の共分散もクリギングの方程式に入ります。

これらの共分散はほとんど常に不明であるため、この時点で行き止まりに到達します。結局のところ、ほとんどのアプリケーションでは、我々は唯一認められている1だけを構成する、すなわち、私たちのデータセット、ランダム変数のそれぞれの実現に1各々の別個の位置に番号を。バリオグラムを入力します。この数学関数は、任意の2つの値の間の共分散がどうあるべきかを示します。これらの共分散が「一貫性がある」ことを保証するように制約されています(数学的に不可能な一連の共分散を決して与えないという意味で:「関連性」の数値測定のすべてのコレクションが実際の共分散行列を形成するわけではありません)。そのため、バリオグラムはクリギングに不可欠です。

参考文献

差し迫った質問に答えたので、ここで止めます。興味のある読者は、Journel&HuijbregtsのMining Geostatistics(1978)やIsaaks&SrivastavaのApplied Geostatistics(1989)などの優れたテキストを参照することで、バリオグラムがどのように推定および解釈されるかを知ることができます。(推定プロセスでは、「バリオグラム」と呼ばれる2つのオブジェクトが導入されていることに注意してください。データから派生した経験的バリオグラムとモデルの、それに装着されてバリオグラムこの回答で「バリオグラム」へのすべての参照がモデルにしているコールをする。。vgm問題となっていますモデルのバリオグラムのコンピューター表現を返します。)バリオグラムの推定とクリギングを適切に組み合わせたより現代的なアプローチについては、Diggle&モデルベースのGeostatistics(2007)(これもRパッケージGeoRとの拡張マニュアルですGeoRglm)。


コメント

ちなみに、クリギングを予測に使用している場合でも、他のアルゴリズムを使用している場合でも、バリオグラムによって得られる関連性の定量的特性は予測手順の評価に役立ちます。すべての空間内挿法はこの観点からの予測子であり、IDW(逆距離加重)などの多くは線形予測子であることに注意してください。バリオグラムは、任意の内挿法の平均値と分散(標準偏差)を評価するために使用できます。したがって、クリギングでの使用をはるかに超える適用性があります。


この詳細な回答をありがとうございます。上記と同じ質問をします。空間相関が場所に依存しないと仮定できない場合はどうなりますか?すべての場所のバリオグラムのモデルを作成する必要があるので、バリオグラムのモデリングが役に立たないのは正しいですか?IDWを使用する方が良いですか?
Kasper 2014

プロセスの2次の定常性を想定できない場合、いくつかのオプションが含まれます(1)プロセスの複数の実現を収集します(時間とともに変化する場合)。(2)局所的な小領域のバリオグラムを推定する(データが多い場合)。(3)バリオグラムが場所によってどのように変化するかについてのパラメトリックモデルを想定します(1DプロセスのGARCHモデルの場合と同様)。私の最後のコメントは直接IDWのようなものに戻って落下の不利益に対処:あなたができるかどうかを推定バリオグラムを、原則的にそれが存在するため、IDWは通常、最適ではありません。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.