タグ付けされた質問 「spatial」

数学的計算で直接空間および空間関係(距離、面積、体積、長さ、高さ、方向、中心性、および/または他の空間特性など)を使用する統計的方法に関する研究分野。

2
ロジスティック回帰に関する質問
バイナリロジスティック回帰を実行して、10年間(1997年から2006年)にわたって独立変数のセットからの競合(従属変数)の有無をモデル化し、毎年107回の観測を行います。私の独立者は: 土地の劣化(2種類の劣化のカテゴリ); 人口増加(0- no; 1-yes); 生計タイプ(0-タイプ1、1-タイプ2); 人口密度(3レベルの密度); NDVI連続(最大野菜生産性); NDVI t − 1(前年の野菜の減少-0-いいえ、1-はい)およびt − 1t−1_{t-1} およびNDVI t − 2(過去2年からの野菜の減少-0-いいえ、1-はい)。トン- 2t−2_{t-2} 私は全く新しいです-これは私の講師が私に与えたプロジェクトです-だから私はいくつかのアドバイスやガイダンスに感謝するでしょう。私はすでにマルチコリニリティについてテストしました。 基本的に、私のデータは10年間(合計1070)をカバーする107の観測単位(空間領域)に分割され、観測単位ごとに、その単位内のその時点の独立変数の条件の「スナップショット」値になります(領域)。ロジスティック回帰(またはテーブル)を設定して、各年の107個の値を個別に認識して、異なる単位年間の一時的なNDVIの変化を評価できるようにする方法を知りたいですか?

3
画像が空間的に接続された別々の領域で構成されているかどうかの統計的尺度
次の2つのグレースケール画像を検討してください。 最初の画像は、蛇行する川のパターンを示しています。2番目の画像はランダムノイズを示しています。 画像が川のパターンを示している可能性があるかどうかを判断するために使用できる統計的尺度を探しています。 川の画像には2つの領域があります:川=高い値とそれ以外の場所=低い値。 その結果、ヒストグラムはバイモーダルになります。 そのため、川のパターンのある画像には高い分散が必要です。 ただし、上記のランダム画像も同様です。 River_var = 0.0269, Random_var = 0.0310 一方、ランダム画像の空間的連続性は低いのに対し、河川画像の空間的連続性は高く、実験バリオグラムに明確に示されています。 分散が1つの数値のヒストグラムを「要約」するのと同じように、実験バリオグラムを「要約」する空間的連続性の尺度を探しています。 この方法では、大きなラグよりも小さなラグで大きな半分散を「罰する」ようにしたいので、次のように思いつきました。 s v a r = ∑nh = 1γ(h )/ h2 svar=∑h=1nγ(h)/h2\ svar = \sum_{h=1}^n \gamma(h)/h^2 lag = 1から15までしか加算しない場合、次のようになります。 River_svar = 0.0228, Random_svar = 0.0488 川の画像の分散は大きくなければならないが、空間分散は低くする必要があるため、分散比を導入します。 r a ti o = v a r / …

2
人口密度推定のモデル
(人口、面積、形状)のデータベースを使用して、人口/面積の一定値を各形状(国勢調査区、区域、郡、州などの多角形)に割り当てることにより、人口密度をマッピングできます。ただし、通常、人口はポリゴン内で均一に分布していません。 ダシメトリックマッピングは、補助データを使用してこれらの密度推定値を調整するプロセスです。この最近のレビューが示すように、それは社会科学の重要な問題です。 それでは、土地被覆の補助地図(またはその他の離散的な要因)を利用できると仮定します。最も単純なケースでは、水域のような明らかに居住できないエリアを使用して、人口がいない場所を特定し、それに応じて、すべての人口を残りのエリアに割り当てることができます。より一般的には、各センサスユニットに刻まれている表面領域を有する部分、。これにより、データセットはタプルのリストに追加されますjjjkkkxjixjix_{ji}i=1,2,…,ki=1,2,…,ki = 1, 2, \ldots, k (yj,xj1,xj2,…,xjk)(yj,xj1,xj2,…,xjk)(y_{j}, x_{j1}, x_{j2}, \ldots, x_{jk}) ここで、はユニットの母集団(エラーなしで測定されたと仮定)であり、厳密にはそうではありませんが、すべてのも正確に測定されたと仮定できます。これらの用語では、目的は各を合計に分割することですyjyjy_{j}jjjxjixjix_{ji}yjyjy_{j} yj=zj1+zj2+⋯+zjkyj=zj1+zj2+⋯+zjk y_j = z_{j1} + z_{j2} + \cdots + z_{jk} ここで、各およびは、土地被覆クラス存在するユニット内の人口を推定します。推定値に偏りがないことが必要です。このパーティションは、密度を国勢調査ポリゴンと土地被覆クラスの交点に割り当てることにより、人口密度マップを改良し。 、Z 、J 、I、J 、I 、Z 、J 、I / X jのI J 番目の I 番目zji≥0zji≥0z_{ji} \ge 0zjizjiz_{ji}jjjiiizji/xjizji/xjiz_{ji}/x_{ji}jthjthj^{\text{th}}ithithi^{\text{th}} この問題は、顕著な点で標準の回帰設定とは異なります。 各の分割は正確でなければなりません。 yjyjy_{j} すべてのパーティションのコンポーネントは非負でなければなりません。 (仮定により)どのデータにもエラーはありません。すべての人口カウントおよびすべての領域は正しいです。 x j iyjyjy_{j}xjixjix_{ji} 「インテリジェントダシメトリックマッピング」メソッドなど、ソリューションには多くのアプローチがありますが、私が読んだものはすべて、アドホックな要素と明らかなバイアスの可能性を持っています。私は、創造的で計算が扱いやすい統計的手法を示唆する答えを探しています。直接の適用は、cの …

1
線形回帰と空間的自己相関
リモートセンシングで取得したいくつかの変数を使用して、特定のエリアのツリーの高さを予測したい。おおよそのバイオマスなどと同様に、まず線形回帰を使用します(最良のアイデアではないことはわかっていますが、これは私のプロジェクトの必須ステップです)。私は空間的自己相関がどれほどひどく影響するか、それが可能な場合にこれを修正する最も簡単な方法は何かを知りたかった。ちなみに私はRですべてをやっています。

2
時空間予報誤差の探索的分析
データ:私は最近、風力発電の生産予測誤差の時空間フィールドの確率的特性の分析に取り組みました。正式には、プロセス (時間的に二回インデックスさTとH)と(空間に一度のpで)Hは、(周りに何か等しいルックアヘッド・回数であること24、規則的にサンプリングし、)Tは、数あること「予測時刻」(つまり、予測が発行される時刻、私の場合は約30000、定期的にサンプリング)、およびnは空間位置の数(グリッドなし、私の場合は約300)。これは天気関連のプロセスであるため、使用できる天気予報、分析、気象測定もたくさんあります。(εpt + h | t)t = 1 … 、T;h = 1 、… 、H、p = p1、… 、pn(ϵt+h|tp)t=1…、T;h=1、…、H、p=p1、…、pn \left (\epsilon^p_{t+h|t} \right )_{t=1\dots,T;\; h=1,\dots,H,\;p=p_1,\dots,p_n}ttthhhpppHHH242424TTTnnn 質問:このタイプのデータに対して実行する探索分析を説明して、プロセスの相互依存構造(線形ではない場合があります)の性質を理解し、プロセスの詳細なモデリングを提案できますか?

1
距離の差の統計的有意性
2次元グリッド上に3000を超えるベクトルがあり、ほぼ均一な離散分布です。ベクトルのいくつかのペアは特定の条件を満たす。注:条件はベクトルのペアにのみ適用され、個々のベクトルには適用されません。約1500個のこのようなペアのリストがあります。これをグループ1と呼びましょう。グループ2には他のすべてのベクトルペアが含まれています。グループ1のペアのベクトル間の距離が、2つのベクトル間の平均距離よりも大幅に短いかどうかを確認したいと思います。どうやってやるの? 統計的検定:中心極限定理は私の事例に適用できますか?つまり、距離のサンプルを使用し、スチューデントのt検定を使用して、条件を満たすサンプルの平均と条件を満たさないサンプルの平均を比較できますか?それ以外の場合、ここではどのような統計的検定が適切でしょうか? サンプルサイズとサンプル数:ここには2つの変数があることがわかります。2つのグループのそれぞれに対して、サイズmのn個のサンプルを取得し、各サンプルの平均を取得する必要があります。nとmを選択する原則的な方法はありますか?それらは可能な限り大きくすべきですか?または、統計的有意性を示す限り、できるだけ小さくする必要がありますか?2つのグループのそれぞれで同じにする必要がありますか?または、より多くのベクトルペアを含むグループ2の方が大きくする必要がありますか?

2
Rでの空間データのクラスタリング
一連の海面水温(SST)の月次データがあり、いくつかのクラスター方法論を適用して、同様のSSTパターンを持つ領域を検出したいと考えています。1985年から2009年まで実行される毎月のデータファイルのセットがあり、最初のステップとして各月にクラスタリングを適用したいと考えています。 各ファイルには358416ポイントのグリッドデータが含まれており、約50%が陸地であり、NAである99.99値でマークされています。データ形式は次のとおりです。 lon lat sst -10.042 44.979 12.38 -9.998 44.979 12.69 -9.954 44.979 12.90 -9.910 44.979 12.90 -9.866 44.979 12.54 -9.822 44.979 12.37 -9.778 44.979 12.37 -9.734 44.979 12.51 -9.690 44.979 12.39 -9.646 44.979 12.36 CLARAクラスタリング手法を試してみたところ、見かけ上は良い結果が得られましたが、それはただの平滑化(グループ化)アイソラインであるようにも思えます。そして、これが空間データを分析するのに最適なクラスタリング手法であるかどうかはわかりません。 このタイプのデータセット専用のクラスタリング方法はありますか?いくつかの参照は、読み始めるのに良いでしょう。 前もって感謝します。
12 r  clustering  spatial 

1
空間コレログラムでU字型のパターンが発生する原因は何ですか?
私は自分の作品で、このパターンがさまざまな距離で空間コレログラムを調べるときに、相関関係のU字型パターンが現れることに気付きました。より具体的には、近距離ビンでの強い正の相関は、距離とともに減少し、特定のポイントでピットに到達し、その後上昇します。 これは、保全エコロジーブログ、マクロエコロジープレイグラウンド(3)–空間的自己相関の例です。 これらのより強い距離でのより強い正の自己相関は、理論的にはToblerの最初の地理法則に違反しているため、データの他のパタ​​ーンが原因であると考えられます。私は、それらが特定の距離でゼロに到達し、その後さらに遠くで0にホバリングすることを期待します(これは、通常、低次のARまたはMA項を持つ時系列プロットで発生します)。 これを行うと、Googleの画像を検索する(参照あなたは、パターンのこの同じタイプの他のいくつかの例を見つけることができ、ここで一つの他の例のため)。パターンがモーラン私のために表示されますが、ゲーリーのC(のために表示されない場合GISサイト上のユーザーは、2つの例を掲載している1、2)。私自身の作業と組み合わせて、これらのパターンは元のデータで観察可能ですが、モデルに空間条件を適合させ、残差を確認すると、それらのパターンは持続していないようです。 私は、時系列分析で似たようなACFプロットを表示する例に出会ったことがないので、元のデータのどのパターンがこれを引き起こすのかわかりません。このコメントのScortchiは、正弦パターン がその時系列で省略された季節パターンによって引き起こされる可能性があると推測しています。同じタイプの空間トレンドが空間コレログラムでこのパターンを引き起こす可能性はありますか?それとも、相関関係の計算方法の他のアーティファクトですか? これが私の作品の例です。サンプルは非常に大きく、薄い灰色の線は、参照分布を生成するための元のデータの19個の順列のセットです(したがって、赤い線の分散はかなり小さいと予想されます)。したがって、プロットは最初のプロットほど劇的ではありませんが、ピットとその後の距離での上昇は、プロットにかなり容易に現れます。(また、他の例と同様に、私の落とし穴は否定的ではないことに注意してください。もしそれによって例が大きく異なる場合、私にはわかりません。) これは、上記のコレログラムを生成した空間分布を確認するためのデータのカーネル密度マップです。

2
完全に分散した点パターンでモランの私が「-1」に等しくないのはなぜですか
ウィキペディアは間違っていますか...それとも理解できませんか? ウィキペディア:白と黒の正方形(「チェスパターン」)は完全に分散しているため、モランのIは-1になります。白い四角がボードの半分に積み重ねられ、黒い四角がもう一方に積み重ねられた場合、モランのIは+1に近くなります。正方形の色のランダムな配置は、Moran's Iに0に近い値を与えます。 # Example data: x_coor<-rep(c(1:8), each=8) y_coor<-rep(c(1:8), length=64) my.values<-rep(c(1,0,1,0,1,0,1,0,0,1,0,1,0,1,0,1), length=64) rbPal <- colorRampPalette(c("darkorchid","darkorange")) my.Col <- rbPal(10)[as.numeric(cut(my.values,breaks = 10))] # plot the point pattern... plot(y_coor,x_coor,col = my.Col, pch=20, cex=8, xlim=c(0,9),ylim=c(0,9)) ご覧のとおり、ポイントは完全に分散しています # Distance matrix my.dists <- as.matrix(dist(cbind(x_coor,y_coor))) # ...inversed distance matrix my.dists.inv <- 1/my.dists # diagonals are "0" diag(my.dists.inv) …

3
空間プロセスのパラメーターの推定
正の整数値のグリッドが与えられます。これらの数値は、そのグリッド位置を占める人の信念の強さに対応する強度を表します(値が高いほど、信念が高いことを示します)。人は一般に、複数のグリッドセルに影響を与えます。n × nn×nn\times n 強度のパターンは「ガウスに見える」はずで、高強度の中心位置があり、強度はすべての方向に放射状に次第に細くなると思います。具体的には、分散のパラメーターとスケールファクターのパラメーターを持つ「スケーリングされたガウス」からの値としてモデル化したいと思います。 2つの複雑な要因があります。 バックグラウンドノイズやその他の影響により、人がいない場合はゼロの値に対応しませんが、値は小さくする必要があります。ただし、これらは不安定になる可能性があり、最初の近似では、単純なガウスノイズとしてモデル化することが困難な場合があります。 強度の範囲は異なる場合があります。1つの例では、値の範囲は1〜10で、別の例では1〜100です。 適切なパラメータ推定戦略、または関連文献へのポインタを探しています。なぜ私がこの問題にまったく間違った方法で取り組んでいるのかについてのポインタも評価されます:)。私はクリギングとガウス過程について読んでいますが、それは私の問題にとって非常に重い機械のようです。

1
地理座標からカーネル密度推定を計算する適切な方法は何ですか?
緯度と経度の座標のリストから2Dカーネル密度推定(kde)を計算する必要があります。しかし、緯度の1度は経度の1度と同じ距離ではありません。これは、個々の核が楕円形になることを意味します。特に、赤道から離れているほどポイントが大きくなります。 私の場合、ポイントはすべて互いに非常に接近しているため、それらを平らな地球に変換しても多くの問題は発生しません。ただし、これが正しくなかった場合に、これを適切に処理する方法については、まだ知りたいと思っています。

2
時系列データの空間的自己相関
一連のポリゴン(約200の不規則な形状の連続したポリゴン)の種の数の年間数の20年のデータセットがあります。私は回帰分析を使用して、各ポリゴンの傾向(1年あたりの数の変化)と、管理境界に基づくポリゴンデータの集約を推測しています。 データに空間的自己相関があると確信しています。これは、集約されたデータの回帰分析に影響を与えます。私の質問は-時系列データのSACテストを実行するにはどうすればよいですか?毎年の回帰の残差のSAC(グローバルモランI)を確認する必要がありますか?または、すべての年で1つのテストを実行できますか? はい、SACがあることをテストしたら、これに対処するのは簡単でしたか?私の統計の背景は最小限であり、私が時空間モデリングで読んだすべては非常に複雑に聞こえます。Rに距離重み付けされた自己共変量関数があることを知っています-これは使用するのが簡単ですか? 私はこの問題についてSACを評価/追加する方法について非常に混乱しており、提案、リンク、または参考資料をいただければ幸いです。前もって感謝します!

3
平均GPSポイントを見つける
ポイントの母集団から平均GPSポイントを見つけるプログラムを書く必要があります。 実際には、次のことが起こります。 毎月、人は同じ静的アセットのGPSポイントを記録します。 GPSの性質上、これらのポイントは毎月若干異なります。 時々人は間違いを犯し、完全に別の場所で間違った評価を記録します。 各GPSポイントには、現在のGPSデータがどれだけ正確であるかを示す確信度の重み(HDOP)があります。より良いHDOP値を持つGPSポイントが、低いものよりも優先されます。 以下をどのように判断しますか: 2つの値と、年齢などの単一の値を持つデータを扱います。(人口の平均年齢を見つける) 外れ値を決定します。以下の例では、これらは[-28.252、25.018]と[-28.632、25.219]になります。 外れ値を除外した後、これで平均GPSポイントを見つけます[-28.389、25.245]。 各ポイントのHDOP値によって提供される「ウェイト」を機能させることができれば、それはボーナスになります。
11 outliers  spatial 

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.