時空間予報誤差の探索的分析


13

データ:私は最近、風力発電の生産予測誤差の時空間フィールドの確率的特性の分析に取り組みました。正式には、プロセス (時間的に二回インデックスさTH)と(空間に一度のpで)Hは、(周りに何か等しいルックアヘッド・回数であること24、規則的にサンプリングし、)Tは、数あること「予測時刻」(つまり、予測が発行される時刻、私の場合は約30000、定期的にサンプリング)、およびnは空間位置の数(グリッドなし、私の場合は約300)。これは天気関連のプロセスであるため、使用できる天気予報、分析、気象測定もたくさんあります。

ϵt+h|tpt=1T;h=1Hp=p1pn
thpH24Tn

質問:このタイプのデータに対して実行する探索分析を説明して、プロセスの相互依存構造(線形ではない場合があります)の性質を理解し、プロセスの詳細なモデリングを提案できますか?


これは非常に興味深い質問です。少なくとも匿名化されたデータのサブセットでプレイすることは可能ですか?予測はどのように生成され、どのようなモデルが使用されましたか?
mpiktas

1
@mpiktasありがとう、適切なARモデリング(各ウィンドファームに1つ)で生成されたと考えることができます。問題はそれほど変わりません。申し訳ありませんが、これらのデータとあまりconfidencialityの問題があり、あなたに何も匿名化...提供することはできません
ロビンジラール

回答:


6

予測誤差のバイアス(系統的に過大/過小評価する傾向[最初の瞬間])とその分散[2番目の瞬間]の両方の時空と気象の影響への依存をモデル化するのに十分なデータがあるようです。

バイアスの調査のために、私は多くの散布図、ヒートマップ、またはヘキサビンプロットを行うだけです。変動性を調べるために、元の誤差を2乗してから、多くの散布図、ヒートマップ、または16進プロットを繰り返します。もちろん、これは多くの偏りがあれば完全に問題ではありませんが、共変量に影響される不均一分散性のパターンを見るのにまだ役立つかもしれません。

私の同僚も良い持っていることを(必要に応じても、高い瞬間のモデル化が可能になります)モデルのこれらの種類を取り付けるための非常に柔軟な方法を詳細に素敵techreportをしたR-ImplementationのgamboostLSSに基づいmboostマイヤー、アンドレアスし; フェンスケ、ノラ; ホフナー、ベンジャミン。Kneib、Thomas、Schmid、Matthias(2010):高次元データのGAMLSS –ブースティングに基づく柔軟なアプローチ。。多くのRAM(データセットはBIGのようです)を備えたマシンにアクセスできると仮定すると、あらゆる種類のセミパラメトリック効果(空間効果またはhの共同効果などの滑らかな表面推定器など)を推定できますth、テンポ空間効果や気象効果のスムーズな相互作用などのテンソル積スプライン。さまざまな瞬間について、節約的で解釈可能なモデルを得るために、同時に用語選択を実行します。このモデルの用語は、予測誤差の時空間自己相関構造を説明するのに十分であることが望まれますが、おそらく、自己相関についてこれらのモデルの残差を確認する必要があります(つまり、いくつかのバリオグラムとACFを見てください)。


+1ありがとう、ファビアン、あなたはまったく正しい、問題は私が十分なデータを持っていないということではない。私の質問は特に相互依存構造に関するものです。散布図、ヒートマップ、および16進プロットは、適切な目的で使用される場合に適したツールです。一般的な加法モデルも非常に強力だと思います。GAMの使用方法に関する良いヒントを提供するBrillingerの素晴らしい論文があります。
ロビンギラード

5

私たち(同僚と私)はついにその論文を書きました。要約するために、デンマークと先読み時間に沿ったエラーの(時空間的)伝播の統計的要約を定量化し、提供するための2つのソリューションを提案しました。

  • 最初の方法では、風力発電所のすべてのペア間および先読み時間のすべてのペアの相関を計算します(これは4つの変数の関数です)。ペアが固定されている場合、相関関数が先読み時間に沿って局所的な最大値を持つことを示しました。これは伝播であると言いました。風力発電所の特定のペアに関連付けられた時間スケールは、この局所最大値が取得される時間ラグによって与えられます。ウィンドファームのすべてのペアの相関の極大値、それを取得できる時間ラグ、およびウィンドファームを結合する空間ベクトルをプロットすると、図1の右側が得られます。

図1

これは、グローバル伝播ベクトル、つまりペア間の伝播速度のある種の空間平均を計算するために使用できます。この一部は図1の左側に示されており、エラーの伝播がデナムルクの東西であると推測します(大した驚きではありませんでした:))。また、伝搬と風の関係(速度、方向)を示すために、さまざまな気象状況に対してこれを条件付きで分析しました。

  • ttR2

図2

2番目のケースでは、時間的な平均伝搬速度が、最初のケースの空間平均で得られたものと同様のマグニチュードを持つことを観察しました。この作品をもっと真剣に見たいなら、論文はこちらです。


+1共有していただきありがとうございます。(最初に表示されたときに質問がありませんでした。)先読み時間でクロスバリオグラムをプロットすることを検討しましたか?最も効果的なものは、従来の平滑化された指向性バリオグラム雲ではありません。代わりに、バリオグラム雲密度の2次元プロットを使用します。その後、それらのクロスバリオグラムを作成して、時間的関係を調べることができます。伝播結果は、このような分析から自動的に表示されるはずです。
whuber

@whuberコメントをありがとう、私はあなたがこのサイトで2つまたは3つ以上の質問を見逃したとはほとんど思わない:)。バリオグラムを使用したあなたのアイデアはつながっているようです(私はバリオグラムの使用にはあまり使いませんが、バリオグラムで定式化できるものはすべて共分散と実用的に同等であるとしばしば信じています...)、それについて考えます。
ロビンジラール

多くのアプリケーションで、共分散はバリオグラムと同等であることは正しいです。ただし、バリオグラムクラウドは視覚的および概念的な補足を提供し、共分散関数だけでは機能しないように見えます。これは、相関行列だけでなく散布図を見ることに少し似ています:数値が明確に明らかにしないパターンを見ることができます。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.