複数の時系列を組み合わせるときに注意すべき問題は何ですか?


10

たとえば、ある地域のさまざまな観測所からの気温の記録など、いくつかの時系列があるとします。地域の気候の側面を説明できる、地域全体の単一の気温の記録を取得したいと考えています。直感的なアプローチは、各タイムステップですべてのステーションの平均をとるだけかもしれませんが、私の統計的なスパイダーセンス(これはまだ十分に連絡していません)は、これはそれほど簡単ではないかもしれないことを示しています。特に、領域全体を平均化すると、極端な温度の極端な部分がいくつか取り除かれ、近くのステーション間の依存関係に問題が発生する可能性があると思います。

このような戦略を試した場合、他にどのような問題に直面する可能性がありますか?それらを克服する方法、またはこの種のデータを組み合わせるより賢明な方法はありますか?

注:回答は、私が提供した空間的な例よりも一般的です。


1
問題は、「地域全体の単一の温度記録」と地域内変動への関心との間の競合にある可能性があります。ソリューションには、これらの2つの問題を調整する何らかの方法が含まれる場合があります。たとえば、分散を領域内コンポーネントと領域間コンポーネントに分割します。
Peter Ellis

@PeterEllis、ええ、私は漠然とそのことを考えていました。質問のために、私は地域内の空間変動性を気にしないと仮定しましょう。
naught101 2012

その場合、あなたが心配しなければならない主なことは、近い駅間の依存関係だと思います。隣の駅を効果的に複製する観測を重み付けする方法を見つければ、大丈夫です。
Peter Ellis

@PeterEllis:わかりました、しかしそれを行うための合理的な物理的な方法がないかもしれません-ステーションの近さは必ずしもそれらがより依存していることを意味するわけではありません-つまり。山脈の反対側にある2つの近い駅は、広い平野にある2つの離れた駅よりも似ていない場合があります。依存関係を統計的に定義する信頼できる方法はありますか?共分散、おそらく...結果として得られる系列のピークはまだ少ない可能性があります(ただし、これは物理的な状況を反映していると思います-広い領域での気温の変化は、単一の場所よりもゆっくりと安定している可能性があります)。
naught101 2012

@naught、質問の空間的側面に関して、あなたの地域はどのように定義されていますか?コメントで、山の反対側にある2つの近い駅は、広い平野にある2つの離れた駅とは異なる可能性があると述べました。分析のために、近接性と類似性に基づいて測点リージョンを再定義することを検討しましたか?それらは必ずしも従来の地域の境界に一致する必要はありません。代わりに、従来のマップの上にプロットできる分析オーバーレイになる可能性があります。
dav

回答:


1

まず、コメントを追加すると言いたいのですが、まだできません(rep)が、質問が好きで参加したかったので、ここで「回答」を示します。また、これは古いと思いますが、面白いです。

最初に、時系列を圧縮するために、PCAのような次元削減手法を使用することは可能でしょうか?最初の固有値が大きい場合、おそらくそれは、固有ベクトルの使用がほとんどのダイナミクスを表すことを意味します。

第二に、より一般的には、時系列の望ましい使用法は何ですか?他のことをあまり知らないので、気温はかなり変動する可能性があります。たとえば、気温の記録が都市の近くにある場合、「ヒートアイランド」タイプの効果が得られます。あるいは、横方向の距離の小さな変化がたまたま垂直方向の距離の大きな変化をもたらします-1つの場所は海抜で海の真上にあり、もう1つの場所は「遠すぎる」のではなく、標高1 kmにある可能性があります。それらは間違いなく異なる温度になります!

これらはほんの一部の考えです。たぶん他の誰かが飛び込んでより良い答えを出すことができるでしょう。


1
いい視点ね。正直なところ、この質問の前後関係が何であったか思い出せず、コメントが誤解を招くように感じました。私は特に、すべてのステーションに共通する変動性を失わないようにすることに関心がありましたが、フェーズはずれています。大陸中のステーションと、寒冷前線が通過する場所を考えてみてください。単純な空間平均は基本的にコールドフロントを削除する可能性がありますが、これは実際には良いことではありません。各ステーションがそれを強く、しかし異なる時間に示すからです。おそらく、各ステーションである種のPCAを実行し、結果を何らかの方法で平均化することは、それを回避する1つの方法かもしれません。
naught101 2013年

わあ、わかりました。その地域の時系列の傾向を特徴付ける場合は、時系列を静止させ、それぞれの平均を0にする必要があります。毎日の周期をそれぞれ(または単に1日の平均を取る)。次に、温度のより低い周波数の変化が残り、それぞれが平均0を中心とします。それが得られたら、PCAなどの次元削減手法を使用して、中心+定常時系列を凝縮できます。質問のコンテキストについて少しお話しいただき、誠にありがとうございます。良いもの!
rbatt 2013年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.