クリギングに関する混乱


9

私はクリギングに関するウィキペディアの記事を読んでいました。と言われても分からなかった

クリギングは、不偏推定量線形最良を計算の、のクリギング分散が不偏状態で最小化されるように。導出も得られませんでした。また、分散を最小化する方法もわかりませんでした。助言がありますか?ZX0Z^バツ0Zバツ0

特に、偏りのない状態で最小化された条件が適用される部分が見つかりませんでした。

だったと思う

E [Z '(x)-Z(x)]の代わりにE [Z'(x0)-Z(x0)]はそうではありません。'はWiki記事のhatに相当します。また、クリギングエラーがどのように導出されるのかわかりませんでした


派生のどこでハングアップしますか?
whuber

クリギングエラーを計算し、不偏条件を課す部分。公平な状態とは推定者の期待を意味し、真の状態は等しいと言っても問題ありません。詳細を含むように投稿を編集しました。
user31820 '19 / 06/19

ウィキペディアの式は読むべきだと思います。E[Z(x0)Z(x0)]
whuber

回答:


13

仮定、ベクトルが未知の平均値の多変量分布を有すると仮定されると既知の分散共分散行列。私たちは、観察するために、このディストリビューションとの願いから予測公平な線形予測を使用して、この情報から:μμμΣz 1z 2z n z 0Z0Z1ZμμμΣz1z2z z0

  • 線形は、予測が係数を決定するためにの形式を取る必要があることを意味します。これらの係数は、多くの場合、事前にわかっているもの、つまりエントリに依存します。λIΣz0^=λ1z1+λ2z2++λzλΣ

この予測子は、確率変数と見なすこともできます。Z0^=λ1Z1+λ2Z2++λZ

  • 公正な手段の期待、その(未知)に等しい平均。 μZ0^μ

書き出すと、係数に関する情報が得られます。

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

2行目は期待値の線形性によるもので、残りはすべて単純代数です。この手順はの値に関係なく機能すると想定されているため、明らかに係数は1になるように合計する必要があります。係数をベクトル表記で書き込むと、これは適切に記述できます。λ = λ I 1 λ = 1μλ=(λi)1λ=1

そのような不偏線形予測子のセットの中で、部屋の平均平方で測定された、実際の値から可能な限り逸脱しないものを探します。これもまた計算です。これは、共分散の双線形性と対称性に依存しています。共分散のアプリケーションは、2行目の合計を担当します。

E[(Z0^Z0)2]=E[(λ1Z1+λ2Z2++λnZnZ0)2]=i=1nj=1nλiλjvar[Zi,Zj]2i=1nλivar[Zi,Z0]+var[Z0,Z0]=i=1nj=1nλiλjΣi,j2i=1nλiΣ0,i+Σ0,0.

係数は、この(線形)制約影響を受けるこの2次形式を最小化することで取得できます。これは、ラグランジュ乗数の方法を使用して容易に解決され、方程式の線形システムである「クリギング方程式」が生成されます。1λ=1

アプリケーションでは、は空間確率過程(「ランダムフィールド」)です。つまり、特定の固定(ランダムではない)位置のセット、それらの位置でのの値のベクトル、は、ある種の多変量分布を持つランダムです。書き込みと、上記分析を適用すると仮定すると、全ての処理手段をの場所同じであると仮定すると、これらの処理値の共分散行列箇所は確実に知られています。Zx0,,xnZ(Z(x0),,Z(xn))Zi=Z(xi)n+1xin+1

これを解釈してみましょう。 仮定(一定の平均と既知の共分散を含む)の下で、係数は任意の線形推定量によって達成可能な最小分散を決定します。この分散をと呼びましょう(「OK」は「通常のクリギング」を意味します)。これは、マトリックスのみ依存します。から繰り返しサンプリングしこれらの係数を使用して、残りの値から値を予測すると、σOK2Σ(Z0Zz0

  1. 平均して私たちの予測は正しいでしょう。

  2. 一般的に、我々の予測約外れるでしょうの実際の値から。z0σOKz0

正確なデータから表面を推定するような実際の状況にこれを適用する前に、もっと多くのことを言う必要があります。空間プロセスの統計的特性が場所ごとに、また実現ごとにどのように変化するかについて、追加の仮定が必要です(ただし、 、実際には、通常、1つの実現のみが使用可能になります)。しかし、この説明は、「最良の」偏りのない線形予測子( "BLUP")の検索が線形方程式のシステムに直接つながる方法をたどるのに十分なはずです。


ちなみに、は同じデータを使用して予備的な手順( "バリオグラフィー"として知られています)で推定されるため、通常行われるクリギングは最小二乗推定とまったく同じではありません これは、が既知である(およびデータから独立したFortioriである)と仮定したこの導出の仮定に反しています。したがって、非常に最初に、クリギングにはいくつかの概念的および統計的な欠陥が組み込まれています。思慮深い開業医は常にこれを認識しており、矛盾を正当化する(試してみる)ためのさまざまな創造的な方法を見つけました。(大量のデータがあると本当に役立ちます。) を同時に推定するための手順が存在するようになりましたΣΣΣ未知の場所の値のコレクションを予測します。この偉業を成し遂げるためには、少し強い仮定(多変量正規性)が必要です。


彼らがクリギングに反対するウェブサイトがそこにあり、彼はいくつかの有効なポイントを持っているようです。ここの最後の段落は非常にわかりやすいと思います。
ウェイン

@ウェインはい、あなたは私が何に反応しているかを言うことができます。しかし、クリギングはコンサルタントによって「スネークオイル」として使用されてきましたが、媒体の(たとえば)小さなサンプルから得られたデータをはるかに大きなデータから得られたデータと比較する「サポートの変更」の理論を含め、多くのことを行っています。その媒体の一部。最終的にクリギングは、今日最も洗練された時空間モデリングの最下部にあります。これは、代替案を評価するための便利な方法でもあります。たとえば、多くの空間補間は線形(または線形化可能)であるため、それらの推定分散をクリギングのそれと比較するのは公正です。
whuber

1

クリギングは、単に空間データの最小二乗推定です。そのため、二乗誤差の合計を最小化する線形不偏推定量を提供します。それは不偏なので、MSE =推定器の分散であり、最小です。


クリギングエラーを計算する部分を取得できませんでした。また、クリギングの分散と分散と混同しています。違いは何で、それらの重要性は何ですか
user31820 '19

@whuber。説明をありがとうございますが、不偏推定値と真の推定量によって予測された値のMSEを計算したときに、方程式の導出を取得できませんでした。その方程式の具体的な2行目
user31820 '19

@whuberまた、あなたの答えと同様のクリギング分散を計算するときに、wikiパーツを取得しませんでした。結果は同じですが、初期条件が異なります。どうして?
user31820
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.