タグ付けされた質問 「spatio-temporal」

5
視覚化のために高次元データを削減する方法
2Dの物理シミュレーションに取り組んでおり、いくつかの時点でデータを時間内に収集しています。これらの離散点は垂直軸に沿っており、軸方向に複数の線があります。これにより、データセットが事実上4Dになります。 たとえば、次の(X、Y)座標にコレクションポイントがあると仮定します。 (0,0)、(1,0)、(2,0) (0,1)、(1,1)、(2,1) (0,2)、(1,2)、(2,2) そして、各ポイントで収集しています。ここで、Pは圧力、Tは温度、U 、Vは速度のXおよびY成分です。シミュレーションの各反復で、これらの変数は9つの収集ポイントすべてに対して保存されます。したがって、私のデータはすべて、空間内の各離散点で時間的に連続しています。{P,T,U、V}{P、T、うん、V}\{P,T,U,V\}PPPTTTうん、Vうん、VU,V たとえば、単一ポイントのデータは次のようになります。 たとえば、すべてのポイントで圧力を常に表示して、垂直波と軸波を表示することに興味があります。これを1本の線(垂直または軸)に沿って行う場合、軸(Y、時間、圧力)のウォーターフォールプロットを使用できます。しかし、3本の垂直線と3本の軸線がある場合、これは6つのウォーターフォールプロットになり、両方向の波動の全体像を取得します。空間座標は離散変数ですが、フィールド(この場合は圧力)と時間が連続しています。 T ≈ 0.000125t≈0.000125t\approx0.000125 すべてを一度に表示する方法はありますか?通常、「4番目の」次元を表示するために色を追加できますが、別の可能なアプローチはありますか?できる限り多くの方法でプロットして、他の人が知らない情報が明らかになるかどうかを確認する予定です。アイデアを提案してください。 シミュレーションが3Dで、5Dの結果データセットがあった場合はどうなりますか?それは可能な視覚化方法を変えますか?

1
適切な相関構造を持つモデルにも自己相関残差パターンが残っていますか?また、最適なモデルを選択する方法はありますか?
環境 この質問ではRを使用していますが、一般的な統計の問題に関するものです。 私は、幼虫の個体数を年に1回、8年間にわたって12箇所からサンプリングした、ガの個体数の成長率に対する死亡率(病気と寄生による死亡率)の影響を分析しています。人口増加率データは、時間の経過とともに明確だが不規則な周期的傾向を示しています。 単純な一般化線形モデルからの残差(成長率〜%disease +%parasitism + year)は、同様に明確ではあるが不規則な周期的傾向を経時的に示しました。したがって、同じ形式の一般化最小二乗モデルも、複合対称性、自己回帰プロセス次数1、自己回帰移動平均相関構造などの時間的自己相関に対処するために、適切な相関構造でデータに適合しました。 モデルはすべて同じ固定効果を含み、AICを使用して比較され、REMLによって適合されました(AICによる異なる相関構造の比較を可能にするため)。Rパッケージnlmeとgls関数を使用しています。 質問1 GLSモデルの残差は、時間に対してプロットしたときに、ほぼ同じ周期的なパターンを表示します。自己相関構造を正確に説明するモデルであっても、そのようなパターンは常に残りますか? 2番目の質問の下で、Rのいくつかの単純化された類似のデータをシミュレートしました。これは、モデル残差の時間的に自己相関するパターンを評価するために必要なメソッドの現在の理解に基づいて問題を示していますが、これは間違っていることがわかっています(回答を参照)。 質問2 考えられるすべての相関構造を持つGLSモデルをデータに適合させましたが、実際には相関構造のないGLMよりも実質的に良好な適合はありません:1つのGLSモデルだけがわずかに優れています(AICスコア= 1.8低い)より高いAIC値。ただし、これはすべてのモデルがGLSモデルが明らかにはるかに優れているMLではなくREMLによって適合されている場合にのみ当てはまりますが、統計書から、REMLを使用して異なる相関構造と同じ固定効果を持つモデルを比較する必要があることを理解していますここでは詳しく説明しません。 明らかに時間的に自己相関するデータの性質を考えると、単純なGLMよりも適度に優れたモデルがない場合、適切な方法を使用していると仮定して、推論に使用するモデルを決定する最も適切な方法は何ですか(最終的に使用したい異なる変数の組み合わせを比較するAIC)? 適切な相関構造を持つモデルと持たないモデルの残差パターンを調査するQ1「シミュレーション」 「時間」の周期的効果と「x」の正の線形効果を持つシミュレートされた応答変数を生成します。 time <- 1:50 x <- sample(rep(1:25,each=2),50) y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1) yは、ランダムな変動を伴う「時間」にわたって周期的な傾向を表示する必要があります。 plot(time,y) そして、ランダムな変動を伴う「x」との正の線形関係: plot(x,y) 「y〜時間+ x」の単純な線形加法モデルを作成します。 require(nlme) m1 <- gls(y ~ time + x, method="REML") モデルは、予想されるように、「時間」に対してプロットされると、残差に明確な周期的パターンを表示します。 plot(time, m1$residuals) …

2
時空間予報誤差の探索的分析
データ:私は最近、風力発電の生産予測誤差の時空間フィールドの確率的特性の分析に取り組みました。正式には、プロセス (時間的に二回インデックスさTとH)と(空間に一度のpで)Hは、(周りに何か等しいルックアヘッド・回数であること24、規則的にサンプリングし、)Tは、数あること「予測時刻」(つまり、予測が発行される時刻、私の場合は約30000、定期的にサンプリング)、およびnは空間位置の数(グリッドなし、私の場合は約300)。これは天気関連のプロセスであるため、使用できる天気予報、分析、気象測定もたくさんあります。(εpt + h | t)t = 1 … 、T;h = 1 、… 、H、p = p1、… 、pn(ϵt+h|tp)t=1…、T;h=1、…、H、p=p1、…、pn \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}ttthhhpppHHH242424TTTnnn 質問:このタイプのデータに対して実行する探索分析を説明して、プロセスの相互依存構造(線形ではない場合があります)の性質を理解し、プロセスの詳細なモデリングを提案できますか?

2
時系列データの空間的自己相関
一連のポリゴン(約200の不規則な形状の連続したポリゴン)の種の数の年間数の20年のデータセットがあります。私は回帰分析を使用して、各ポリゴンの傾向(1年あたりの数の変化)と、管理境界に基づくポリゴンデータの集約を推測しています。 データに空間的自己相関があると確信しています。これは、集約されたデータの回帰分析に影響を与えます。私の質問は-時系列データのSACテストを実行するにはどうすればよいですか?毎年の回帰の残差のSAC(グローバルモランI)を確認する必要がありますか?または、すべての年で1つのテストを実行できますか? はい、SACがあることをテストしたら、これに対処するのは簡単でしたか?私の統計の背景は最小限であり、私が時空間モデリングで読んだすべては非常に複雑に聞こえます。Rに距離重み付けされた自己共変量関数があることを知っています-これは使用するのが簡単ですか? 私はこの問題についてSACを評価/追加する方法について非常に混乱しており、提案、リンク、または参考資料をいただければ幸いです。前もって感謝します!

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
複数のサイトの時系列温度データを1つのサイトのデータの関数としてモデル化する方法は?
私は時系列分析に不慣れです。次の時系列回帰問題にどのように対処するのが最善かについての提案をいただければ幸いです。1か所のサイト全体で約20か所の1時間ごとの温度測定と静的な補助情報(勾配、標高、アスペクト、キャノピーカバー)。サイトのサイズは数ヘクタールで、温度記録デバイスは、20〜50 m間隔で、いくつかのトランセクトに沿ってサイト全体に広がっています。約1 km先の気象観測所からの時間別データがあり、風速、風向、湿度、太陽照度などの測定値も提供しています。 ウェザーステーションからのデータのみを使用して、サイトの温度(最小、最大、平均)を(一般的に)予測できるようにしたいと思います。半永久的に設置されているのに対し、現場の温度記録計は3年間しか設置されていませんでした。つまり、本質的に、1つの場所(気象観測所)に複数の独立変数(温度、湿度、風など)がありますが、複数の場所に1つの従属変数(温度)があり、それぞれに複数の時間不変属性があります:勾配、標高、アスペクトなど 私は、サイト内の各温度記録場所の1時間ごとの温度ではなく、サイト全体の毎日の最低気温と最高気温を予測することに最も関心があります。ただし、これらの時間ごとの予測は確かに価値があります。 私の最初のアプローチは、サイトの温度から毎日の平均、最小、および最大を計算し、ウェザーステーションで利用可能な測定を独立変数として使用して、これらを単純な線形回帰の従属変数として使用することでした。これは適度に機能します(2つの予測子でR2> 0.50)。しかし、多くの理由でかなり単純すぎるように思われます。これを行うには、より洗練された(そして強力な)方法が必要だと思います。 まず、私は回帰における毎日の値の時系列の性質については何も明示していませんが、ある日から次の日までの最小または平均気温は、1時間から次に、これらの日次データの独立性に関する問題について疑問に思います(時間ごとの気温を予測しようとした場合は、確かに時間ごとです)。第2に、サイト全体でいくらか相関のある複数の温度測定があることに懸念があるため(気象ステーションのデータと比べて、それらの間の温度測定は非常に類似しています)、サイト全体のすべての測定値の平均または最小値または最大値を使用しています。と比較して、個々の測定場所からのデータを直接含めます。しかし、これにより、各温度測定場所(勾配、標高、アスペクト、キャノピーカバー)、おそらくサイトの場所間の温度差のかなりの部分を説明します。第三に、回帰が気温の非常に強い日周サイクルによって支配されているという懸念のために、私は時間単位ではなく日単位の値のみを調べています。 これを行うためのより良い方法(特にRの場合)、またはどこから探し始めるかについての提案は、最も高く評価されます!時系列を扱うRパッケージがたくさんあることに気づきましたが、このような問題から始めるのに最適な場所を見つけるのに苦労しています。ここでモデル化しようとしています。 更新:これについてもう少し考えます。時系列モデルが本当に適切かどうかは、将来の特定の時点で何が起こるかを予測する必要がないため、ここではわかりません。むしろ、私は単にサイトの温度がウェザーステーションの温度(および他の環境変数)にどのように関連しているかに単に興味があります。後の温度測定が十分に独立していないのではないかと心配したため、おそらく時系列分析は価値があると思いました。確かに、1時間の温度は前の時間に大きく依存しますが、日次データの依存性は弱くなります。どちらの場合も、時系列データの時間相関/非依存性は、時系列予測に関心がない場合に対処する必要がある有効な懸念事項ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.