タグ付けされた質問 「spatial」

数学的計算で直接空間および空間関係(距離、面積、体積、長さ、高さ、方向、中心性、および/または他の空間特性など)を使用する統計的方法に関する研究分野。

1
クリギング補間はどのように機能しますか?
私は、周囲のいくつかの変数に基づいていくつかの変数の値を予測するためにクリギングを使用する必要がある問題に取り組んでいます。自分でコードを実装したい。それで、私はそれがどのように機能するかを理解するためにあまりにも多くの文書を調べましたが、私はとても混乱していました。一般に、加重平均だと理解していますが、重みを計算して変数の値を予測するプロセスを完全には理解できませんでした。 誰かがこの補間方法の数学的な側面とそれがどのように機能するかを簡単な言葉で私に説明していただけますか?

1
固有の空間定常性:小さなラグにのみ適用されませんか?
本質的な定常性の定義から: E[Z(x)−Z(x−h)]=0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0 この仮定は、たとえば通常のクリギングで使用され、空間全体の平均が一定であると仮定する代わりに、平均が局所的に一定であると仮定します。 近隣で平均が一定である場合、互いに近い2つの測定値の差がゼロになることを論理的に期待します。しかし、平均は空間によって異なるため、互いに離れた値の差がゼロになるとは予想していませんか? したがって、固有の定常性の仮定は次のようにすべきではありません。 for h → 0E[Z(x)−Z(x−h)]=0E[Z(x)−Z(x−h)]=0E[Z(x)-Z(x-h)] = 0h→0h→0h \to 0
10 spatial 

3
2D正方形の点の分布の均一性を測定する
2Dの正方形があり、その中に一連のポイントがあります。たとえば、1000ポイントです。正方形内のポイントの分布が広がっているか(または多かれ少なかれ均一に分布しているか)、または正方形内のいくつかのスポットに集まる傾向があるかどうかを確認する方法が必要です。 これを決定するための数学的/統計的(プログラミングではない)方法が必要です。私はググって、適合度、コルモゴロフなどのようなものを見つけました、そしてこれを達成する他のアプローチがあるのか​​と思っています。クラスペーパーにはこれが必要です。 入力:2D正方形、および1000ポイント。出力:はい/いいえ(はい=均等に広がる、いいえ=一部のスポットに集まる)。

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
線形モデルの空間共分散をどのように説明できますか?
バックグラウンド 私は、2つのブロックのそれぞれに4つの処理レベルと6つの複製があるフィールド調査のデータを持っています。(4x6x2 = 48観測) ブロックは約1マイル離れており、ブロック内には、42のグリッド、2m x 4mの区画、および1mの幅の歩道があります。私の研究では、各ブロックで24のプロットのみを使用しました。 空間共分散の評価を評価したいと思います。 以下は、空間共分散を考慮しない、単一ブロックのデータを使用した分析の例です。データセットで、plotはプロットID、xはy各プロットのx位置とy位置で、プロット1は0を中心とし、0 levelは処理レベルでresponseあり、は応答変数です。 layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L, 17L, 18L, 22L, 23L, 26L, 28L, 30L, 31L, 32L, 35L, 36L, 37L, 39L, 40L, 42L), level = c(0L, 10L, 1L, 4L, 10L, 0L, 4L, 10L, 0L, 4L, …

2
「等間隔の」サンプルから始まるユニットディスクの回帰
ユニットディスク上の複雑な回帰問題を解決する必要があります。元の質問は興味深いコメントを集めましたが、残念ながら回答はありませんでした。それまでの間、この問題についてさらに多くのことを学びました。したがって、元の問題をサブ問題に分割して、今回の運が良かったかどうかを確認します。 ユニットディスク内の狭いリングに規則的に配置された40個の温度センサーがあります。 これらのセンサーは時間内に温度を取得します。ただし、時間の変動は空間の変動よりもはるかに小さいため、時間の変動を無視して問題を単純化し、各センサーが時間平均のみを与えると仮定します。これは、40のサンプル(各センサーに1つ)があり、繰り返しのサンプルがないことを意味します。 センサーデータから回帰曲面を作成したいと思います。回帰には2つの目標があります。T=f(ρ,θ)+ϵT=f(ρ,θ)+ϵT=f(\rho,\theta)+\epsilon 平均半径方向温度プロファイルを推定する必要があります。線形回帰では、平均温度面である面をすでに推定しているので、に関して面を統合するだけでよいのですよね?回帰に多項式を使用する場合、この手順は簡単なはずです。Tmean=g1(ρ)+ϵTmean=g1(ρ)+ϵT_{mean}=g_1(\rho)+\epsilonθθ\theta 放射状の温度プロファイルを推定する必要があります。これにより、各放射状の位置でます。T95=g2(ρ)+ϵT95=g2(ρ)+ϵT_{95}=g_2(\rho)+\epsilonP(T(ρ)&lt;T95(ρ))=.95P(T(ρ)&lt;T95(ρ))=.95P(T(\rho)<T_{95}(\rho))=.95 これら2つの目標を踏まえて、ユニットディスクの回帰にはどの手法を使用すればよいですか?もちろん、ガウスプロセスは一般的に空間回帰に使用されます。ただし、ユニットディスクの適切なカーネルの定義は簡単なものではないため、失う戦略だと思わない限り、物事を単純に保ち、多項式を使用したいと思います。ゼルニケ多項式について読みました。ゼルニケ多項式は周期的であるため、単位ディスクの回帰に適しているようです。θθ\theta モデルを選択したら、推定手順を選択する必要があります。これは空間回帰問題であるため、さまざまな場所でのエラーは相関させる必要があります。通常の最小二乗法は相関のないエラーを想定しているため、一般化された最小二乗法がより適切だと思います。gls標準R分布に関数がある場合、GLSは比較的一般的な統計手法のようです。しかし、私はGLSを使用したことがなく、疑問があります。たとえば、共分散行列をどのように推定しますか?少数のセンサーを使用したとしても、うまくいった例は素晴らしいでしょう。 PS私はゼルニケ多項式とGLSを使用することを選択しました。これは、ここで行うのが論理的であるように思えるためです。ただし、私は専門家ではありません。私が間違った方向に進んでいると感じた場合は、完全に異なるアプローチを自由に使用してください。

1
クリギングするときにバリオグラムモデルを提供する必要があるのはなぜですか?
空間統計とチュートリアルをたくさん見て、 しかし、私があなたがクリゲするときにバリオグラムモデルを提供しなければならない理由は本当にわかりません。 私はRでgstatパッケージを使用していますが、これは彼らが与える例です: library(sp) data(meuse) coordinates(meuse) = ~x+y data(meuse.grid) str(meuse.grid) gridded(meuse.grid) = ~x+y m &lt;- vgm(.59, "Sph", 874, .04) print(m) # ordinary kriging: x &lt;- krige(log(zinc)~1, meuse, meuse.grid, model = m) 最初にvgmを指定する必要がある理由を数行で説明できる人はいますか?そして、どのようにパラメータを設定しますか? 前もって感謝します!キャスパー
9 spatial 

1
空間統計に関する推奨書籍
i)空間ドメイン全体での単変量変数と多変量変数(実数、カウントデータ)の変動性を研究するのに最適な本は何ですか。ii)空間位置全体の分布に基づいて、単変量または多変量変数をサンプリングします。(要するに空間サンプリング)

1
座標を予測子とする回帰による空間トレンドのモデリング
データに存在する空間トレンドを調整するために、回帰方程式に共変量として座標を含める予定です。その後、ランダム変動の空間自己相関の残差をテストしたいと思います。いくつか質問があります。 独立変数のみが座標と座標である線形回帰を実行してから、空間自己相関の残差をテストする必要がありますか、それとも共変量として座標だけでなく他の変数も含めてから残差をテストする必要があります。yxxxyyy 二次傾向があると予想し、だけでなく、、、も含める場合、それらの一部(および)は、値がしきい値- より大きな値を持つ変数を重要ではないものとして除外する必要がありますか?次に、傾向をどのように解釈すればよいでしょうか?これは確かにもう二次式ではありませんか?x y x 2 y 2 x y y 2 p px,yx,yx,yxyxyxyx2x2x^2y2y2y^2xyxyxyy2y2y^2pppppp 私は座標と座標を他の共変量と同様に扱い、部分残差プロットを作成して従属変数との線形関係をテストする必要があると思いますが、一度変換すると(変換が必要であることがわかった場合)、それはできませんそのような傾向になります(特に、次傾向の、およびを含める場合)。これは、ことを示していることがあり一方で、例えば、変換を必要としないか、そうですか?これらの状況でどのように対応すべきですか?y x y x 2 y 2 x 2 xxxxyyyxyxyxyx2x2x^2y2y2y^2x2x2x^2xxx ありがとうございました。

3
GPS追跡における推定問題
問題:リーダーとフォロワーという名前の2台の車(点オブジェクトと見なされます)を考えます。どちらも互いに通信するGPSデバイスを備えています。の目的は、が平面上を任意に移動するときに、できるだけ追従することです。すべてのGPSデバイスに、所定の平均と所定の共分散行列持つエラーの循環エラー確率(CEP)分布があるとます。F F L μ = (μ X、μ Y)Σ 2 × 2LLLFFFFFFLLLμ =(μバツ、 μy)μ=(μx,μy)\mu = (\mu_x,\mu_y)Σ2 × 2Σ2×2\Sigma_{2\times 2} ことを考えると(区分的に滑らかな)曲線横断平面内で横断予想曲線何?さらに、のパスの分布はどのようなものですか?C F FLLLCCCFFFFFF がある期間にわたってを推定する最適な方法は何ですか?LFFFLLL 背景:これは私が実験的な作業で直面した実際的な問題であり、宿題ではありません。ホワイトノイズに直面して最適な状態推定を行うためのカルマンフィルタリングなどのツールは知っていますが、これらをこのケースに拡張する方法について正確にはわかりません。また、関連する研究文献についても知りたい。


3
1%マイクロデータサンプルを大規模に使用し、統計を小さな領域スケールで集計して、どのようにして小さな領域の人口調査マイクロデータをシミュレーションできますか?
個人レベルの多変量解析を、地理的集計の小さなレベル(オーストラリアの国勢調査区)で実行したいと思います。明らかに、プライバシーの理由から、これらの小さなレベルの集計では国勢調査を利用できないため、他の代替案を調査しています。関心のある変数のほとんどすべてがカテゴリカルです。自由に使える2つのデータセットがあります。 1%の国勢調査サンプルは、はるかに高いレベルの空間集約(人口が約190,000で、人口統計の空間分離が広大な地域)で利用できます。 小領域レベルで関心のある変数の度数分布表(500小領域、平均ポップ= 385、sd = 319、中央値= 355)。 これらの2つのデータセットを使用して、小区域の実際の人口にできるだけ近い小区域レベルでの人口分布をシミュレートするにはどうすればよいですか? これを行うための通常の方法があることを私は感謝しています。もしそうなら、教科書または関連する雑誌の記事へのポインタが非常に高く評価されます。

2
Rでのノイズを伴うアプリケーションの密度ベースの空間クラスタリング(DBSCAN)クラスタリング
この質問は「Rでの空間データのクラスタリング」から始まり、現在はDBSCANの質問に移動しています。 最初の質問への回答が示唆したように、私はDBSCANに関する情報を検索し、いくつかのドキュメントを読みました。新しい質問が発生しました。 DBSCANにはいくつかのパラメータが必要です。そのうちの1つは「距離」です。私のデータは3次元、経度、緯度、および温度なので、どの「距離」を使用する必要がありますか?どの距離がその距離に関連していますか?温度だと思います。Rでそのような最小距離を見つけるにはどうすればよいですか? 別のパラメーターは、クラスターを形成するために必要なポイントの最小数です。その数を見つける方法はありますか?残念ながら見つかりませんでした。 Googleで検索すると、私のようなデータセットでdbscanを使用するためのRの例が見つかりませんでした。そのような種類のWebサイトを知っていますか?だから私は読んで私のケースに適応しようとすることができます。 最後の質問は、DBSCANを使用した最初のR試行(前の質問に対する適切な回答なし)がメモリ問題を引き起こしたということです。Rは、ベクトルを割り当てることができないと言います。有効ではないSSTポイントを削除する場合、約300000行x 3列(緯度、経度、温度)で終わる779191ポイントの4 km間隔のグリッドから始めます。このメモリの問題に対処するためのヒント。それは私のコンピューターに依存していますか、それともDBSCAN自体に依存していますか? 長くて退屈なメッセージを読むのを辛抱強く、そしてあなたの助けをありがとう。
9 r  clustering  spatial 

1
通常のクリギングの例
geoRand gstat(およびautomap)の両方を使用した空間クリギングのチュートリアルをオンラインで実行しました。空間クリギングを実行でき、その背後にある主要な概念を理解しています。セミバリオグラムを作成する方法、モデルをそれに適合させる方法、および通常のクリギングを実行する方法を知っています。 私が理解していないのは、周囲の測定値の重みがどのように決定されるかです。私はそれらがセミバリオグラムから派生し、予測位置からの距離と測定された点の空間配置に依存していることを知っています。しかし、どうやって? 誰もが3つのランダムな測定点と1つの予測位置を使用して通常のクリギング(非ベイジアン)モデルを作成できますか?それは啓発的でしょう。

2
PCAの最初の固有ベクトルが、基になるトレンドの導関数に似ているのはなぜですか?
PCAを使用して空間的に関連するいくつかの時系列を分析しています。最初の固有ベクトルは系列の平均トレンドの導関数に対応しているようです(以下の例を参照)。なぜ最初の固有ベクトルがトレンド自体ではなくトレンドの導関数に関連しているのか知りたいのですが。 データは行列に配置され、行は各空間エンティティの時系列であり、列(およびPCAの次元)は年です(つまり、以下の例では、7年ごとに10の時系列)。PCAの前に、データも平均中心です。 Stanimirovic et al。、2007も同じ結論に達しましたが、それらの説明は、線形代数についての私の理解を少し超えています。 [更新]- 提案どおりにデータを追加します。 [Update2]-回答済み。結果をプロットするときに、コードが固有ベクトル行列の転置を誤って使用していることを発見しました(excel_walkthrough)(ありがとう@amoeba)。この特定のセットアップで転置固有ベクトル/微分関係が存在するのは単なる偶然のようです。この投稿で数学的かつ直観的に説明されているように、最初の固有ベクトルは、実際には、その派生物ではなく、基になるトレンドに関連しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.