クリギング補間の最小サンプル数


19

私は、クリギング法を使用して補間するためのリクエストとともに、いくつかの標本でいくつかのデータを取得します。
調査の結果、クリギングの結果(ArcGIS Geostatistical Analystでデフォルトのパラメーターを使用して実行)は満足のいくものではないようでした。補間された値は、測定値(特に一番上の値)とは大きく異なり、表面は信頼できるようには見えません。写真は次のとおり ここに画像の説明を入力してください
です。主な問題はサンプル数が不十分だと思います。

信頼できる結果を得るには、何ポイント使用する必要がありますか?
それとも、クリギング法はそのような多様な価値に適していませんか?


「1980年代後半に米国EPAが発行したロバートジャーニガンのモノグラフにあるように、人々はわずか7つのデータポイントを首尾よくクリギングしましたが...」とあなたは言いました。しかし、私はこの記事を見つけることができません。この記事の公開アドレスを教えてもらえますか?...ありがとう
abilici

回答:


30

「デフォルト値」を使用する場合、実際にはクリギングではなく、クリギングアルゴリズムを適用しているだけです。これは、これらのデータで使用した場合は不十分です。

(私は簡単な口調でソープボックスにステップアップします:私の意見では、コンピュータープログラムで悪い結果を得るための最速の方法は、デフォルトのパラメーターを受け入れることです。ArcGISは、道。道徳的ISは、あなたがそれを制御する方法を理解するまで、重要な仕事のためのソフトウェアを使用していない。演説からダウンになりました...)

クリギングが機能するには、「バリオグラフィー」として知られるデータの集中的な予備的な統計分析を行う必要があります。これが最終的にどれだけうまく機能するかは、データと地球統計のスキルに依存します。(全体の本は精液を含め、variographyについて書かれている鉱業地球統計学 Journel&HuijbregtsとすることによりVariowinイヴァンPannatierによる。)ロバート・ジャーニガンによってモノグラフにおける7つのデータポイントは(米国EPAによって発行された人々が正常にいくつかのようkrigedているが1980年代後半)、そして原則的にあなただけの二、三のポイントを使用してkrigeすることができます(私がしているアルゴリズムを示すためにこれを行って)、20ポイントの最小値から100点までの文献の範囲と親指のルール合意 約30ポイントのようです。

あなたのケースでは、データを記述していませんが、非常に歪んだ分布や定常性の明確な証拠の欠如など、いくつかの明確な問題があります。これらには、特別な統計処理または特殊な形式のクリギング(空間一般化線形モデルなど)が必要です。非常に大量のデータを取得するまで、このようなデータをクリギングする場合、良い結果は得られません。

凡例は、実際にデータを補間するのではなく、密度グリッドを作成しようとしている可能性があることを示唆しています。2つの手順の出力は同じように見えますが、明らかに異なることを行い、解釈が明確に異なります。あなたは、補間データを考慮した場合のサンプルをいくつかの仮想的な連続面から。補間は、非サンプリング値を予測します。標準的な例には、標高測定(地球の表面をサンプリングする)および温度測定(「温度場」をサンプリングする)が含まれます。に関する完全な情報が得られたら、密度を計算します単位面積あたりのその量の平滑化されたバージョンを表すことを望みます。(補間とは対照的に、予測する非サンプリング値は存在しません。)標準的な例は人口密度です。データはエリア内のすべての個人のカウントです。出力は人口密度のマップです。


6
素晴らしい答え@whuber。ただし、ポイントの最小数は、空間領域の範囲と予測の目的の粒度にも部分的に依存していませんか?サンプリングの問題にまで絞り込むと、サンプルの母集団と空間的変動を把握することが問題になります。
ジェフリーエヴァンス

@ジェフリーそれは部分的にそうです。データの量は、クリギング予測分散(空間領域で変化する)とバリオグラム自体を推定できる精度の2つに関係します。特にクリギングの伝統的な治療では、後者はしばしば見落とされます。それは部屋の中の一種の象です。正しいバリオグラムを知っていて、ナゲット/シル比が小さく、空間領域の範囲に対して範囲が広い場合、特にデータ値の全範囲を適切にサンプリングする場合、著しく少ないデータでクリゲできます。
whuber

3
クリギングを使用する人は、優れた地球統計学コースを必要とするか、GIS /統計学の強固な背景を持っている必要があると確信しています。セミバリオグラムを適切にモデル化する方法を学習するには、ある程度のスキルが必要です。
マイクT

1
私が考えてきた経験則:全方向クリギングでは30ポイント、双方向では100ポイント。
ジャーレク

1

2つの質問があります。1つ目は、バリオグラムの推定/モデリングに使用するデータ位置の数、2つ目は、非データ位置で値を補間する(または平均値を推定する)クリギング方程式で使用するデータ位置の数です地域を超えて)。移動検索近傍を使用していると仮定すると、(1)検索近傍内の最も近いデータ位置のみが非ゼロの重みを持ち、(2)より多くのデータを持つため、近傍内の15-20を超えるデータ位置は結果を低下させる可能性があります反転するマトリックスのサイズが大きくなり、条件の悪いマトリックスが発生する可能性が高くなります。クリギングに必要なデータロケーションの総数は、補間するロケーションの数と、それらのポイントおよびデータロケーションの空間パターンに依存します。要するに、

バリオグラムの推定/モデリングに関しては、非常に異なる問題です。たとえば、

1991年、マイヤーズ、DE、第一インターの議事録におけるバリオグラム推定について。確認 統計 Comp。、Cesme、トルコ、

1987年3月30日から2月2日、Vol II、American Sciences Press、261-281

1987年、A。ウォリックおよびDEマイヤーズ、バリオグラム計算のためのサンプリング場所の最適化水資源研究23、496-500

これらはwww.u.arizona.edu/~donaldmからダウンロードできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.