タグ付けされた質問 「circular-statistics」

方向統計(円形または球統計とも呼ばれます)は、方向(単位ベクトル)、軸(の原点を通る線)、または回転を扱う統計の分野です。 RnRnRn

3
時間はカテゴリー変数ですか?
値が0、1、2、...、23になりうる「時間帯」はカテゴリ変数ですか?たとえば、5は3または7よりも4または6に「近い」ため、ノーと言いたくなるでしょう。 一方、23と0の間には不連続性があります。 それで、それは一般にカテゴリー的であると考えられますか?「時間」は独立変数の1つであり、予測しようとしている変数ではないことに注意してください。

4
ディスク上の均一な分布をシミュレートする
私は、円の任意の部分に欠陥がある可能性が同じになるように、円内のランダムなポイントの注入をシミュレートしようとしました。円を等面積の長方形に分割すると、結果の分布の面積あたりのカウントがポアソン分布に従うと予想しました。 円形領域内にポイントを配置するだけなので、極座標で2つの均一なランダム分布を注入しました:(半径)と(極角)。RRRθθ\theta しかし、この注入を行った後、私は明らかに、エッジと比較して円の中心により多くのポイントを取得します。 ポイントがサークル全体にランダムに分散されるように、円全体にこの注入を実行する正しい方法は何でしょうか?

2
循環データを使用して分散の等価性をテストする方法
8つの異なるサンプル(それぞれ異なる母集団から)内の変動の量を比較することに興味があります。これは、比率データを使用したいくつかの方法で実行できることを知っています:F検定の分散の等価性、リーベン検定など。 ただし、私のデータは円形/方向(つまり、風向や一般的な角度データ、または時刻などの周期性を示すデータ)です。私はいくつかの研究を行った結果、Rの「CircStats」パッケージに「Watson's test for homogeneity」という1つのテストが見つかりました。1つの欠点は、このテストでは2つのサンプルのみを比較することです。つまり、8つのサンプルで複数の比較を行う必要があります(その後、Bonferonni補正を使用します)。 私の質問は次のとおりです。 1)使用できるより良いテストはありますか? 2)そうでない場合、ワトソンのテストの前提は何ですか?パラメトリック/ノンパラメトリックですか? 3)このテストを実行できるアルゴリズムは何ですか?私のデータはMatlabにあり、テストを実行するためにRに転送する必要はありません。むしろ自分の関数を書くだけです。

4
ニューラルネットワークの角度データのエンコード
ターゲットデータが角度のベクトル(0〜2 * pi)であるニューラルネットワーク(詳細は重要ではありません)をトレーニングしています。このデータをエンコードする方法に関するアドバイスを探しています。私が現在試みていることは次のとおりです(成功は限られています)。 1)1-of-Cエンコード:設定可能な角度を1000程度の離散的な角度にビン化し、関連するインデックスに1を入力することで特定の角度を示します。これに関する問題は、ネットワークがすべての0を出力することを単に学習することです(これはほぼ正確であるため)。 2)単純なスケーリング:ネットワーク出力範囲([0,1])を[0,2 * pi]にスケーリングしました。ここでの問題は、角度が自然に円形のトポロジを持っていることです(つまり、0.0001と2 * piは実際には互いに隣り合っています)。このタイプのエンコードでは、その情報は失われます。 任意の提案をいただければ幸いです!

1
線形回帰での循環予測子の使用
風のデータ(0、359)と時刻(0、23)を使用してモデルを近似しようとしていますが、線形パラメーターではないため、線形回帰にうまく適合しないことが心配です。Pythonを使用してそれらを変換したいと思います。少なくとも風の場合には、度のsinとcosを使用してベクトル平均を計算することについて言及しましたが、全体ではありません。 役立つかもしれないPythonライブラリまたは関連するメソッドはありますか?

2
標準偏差の三角演算
通常のランダム変数の加算、減算、乗算、除算は明確に定義されていますが、三角演算はどうですか? たとえば、両方とも正規分布として記述された寸法d1d1d_1およびを持つ2つのカテテリーを持つ三角形のくさび(直角三角形としてモデル化された)の角度を見つけようとしていると仮定しますd2d2d_2。 直観とシミュレーションの両方から、結果の分布は平均arctan(mean(d1)mean(d2))arctan⁡(mean(d1)mean(d2))\arctan\left(\frac{\text{mean}(d_1)}{\text{mean}(d_2)}\right)。しかし、結果の角度の分布を計算する方法はありますか?私が答えを見つける場所の参照 (少しのコンテキストでは、機械部品の統計的公差に取り組んでいます。最初の衝動は、プロセス全体を単純にシミュレートし、最終結果が合理的に正常かどうかを確認し、標準偏差を計算することです。きちんとした分析的アプローチがあるかもしれない場合)

1
循環データの時系列モデリング
風/波データのARIMAモデルを構築しています。変数ごとに個別のモデルを作成しています。 モデル化する必要がある変数の2つは、波と風の方向です。値は度(0-360°)です。値の間隔が循環するこのタイプのデータをモデル化することは可能ですか?そうでない場合、どの種類のモデルがこの種のデータに最適ですか?

1
IVとしての方向データを使用したロジスティック回帰
方向データ(度単位の方向の尺度)を回帰の独立変数として使用するための適切な参照を探しています。理想的には、階層的な非線形モデルにも役立ちます(データはネストされています)。また、より一般的な方向データにも興味があります。 マルディアのテキストを見つけましたが、それを手に入れるつもりですが、良い記事があるのではないかと思いました。 私は、定理や証明、または分布などの正式な記述よりも、このタイプのデータをどのように扱うかについての実用的な記事に興味があります。ありがとう 更新マルディアのテキストを入手しました。これは非常に包括的なものです。もう少し読んだ後、さらに質問があります。

1
循環統計の高次モーメントの直観
循環統計では、円上の値を持つ確率変数の期待値は、として定義され ます(wikipediaを参照)。これは、分散定義と同様に、非常に自然な定義 したがって、分散を定義するために2番目の瞬間は必要ありませんでした!ZZZSSSm1( Z)= ∫SzPZ(θ )のD θm1(Z)=∫SzPZ(θ)dθ m_1(Z)=\int_S z P^Z(\theta)\textrm{d}\theta V a r( Z)= 1 − | m1( Z)| 。Var(Z)=1−|m1(Z)|。 \mathrm{Var}(Z)=1-|m_1(Z)|. それにもかかわらず、より高いモーメントを定義します これは一見するとかなり自然に見え、線形統計の定義に非常に似ていることを認めます。しかし、それでも私は少し不快に感じ、以下を持っていますmn( Z)= ∫SznPZ(θ )D θ 。mn(Z)=∫SznPZ(θ)dθ。 m_n(Z)=\int_S z^n P^Z(\theta)\textrm{d}\theta. 質問: 1. 上記で定義されたより高いモーメントによって(直感的に)測定されるものは何ですか?分布のどの特性がモーメントによって特徴付けられますか? 2.高次モーメントの計算では、複素数の乗算を使用しますが、ランダム変数の値は単に平面内のベクトルまたは角度として考えます。この場合、複素乗算は基本的に角度の加算であることを知っていますが、それでもなお、 なぜ複素乗算は循環データにとって意味のある演算なのでしょうか?

5
使用するのに最適な距離測定
環境 比較したい2組のデータがあります。両方のセット内の各データ要素は、(すべての間に22件の角度を含むベクターである−π−π-\pi及びππ\pi)。角度は特定の人間のポーズ構成に関連しているため、ポーズは22の関節角度によって定義されます。 最終的に私がやろうとしているのは、2つのデータセットの「近さ」を判断することです。そのため、1つのセットの各ポーズ(22Dベクトル)について、他のセットの最も近い隣を見つけ、最も近い各ペアの距離プロットを作成します。 ご質問 単純にユークリッド距離を使用できますか? :意味のあるものにするには、私は距離メトリックは、次のように定義される必要があることを前提と、ここで | 。。。| は絶対値で、modはモジュロです。次に、結果の22シータを使用して、標準のユークリッド距離計算を実行できます。√θ=|θ1−θ2|modπθ=|θ1−θ2|modπ\theta = |\theta_1 - \theta_2| \quad mod \quad \pi|...||...||...|。t21+t22+…+t222−−−−−−−−−−−−−−√t12+t22+…+t222\sqrt{t_1^2 + t_2^2 + \ldots + t_{22}^2} これは正しいです? カイ2乗、Bhattacharyya、または他のメトリックなど、別の距離メトリックがより有用でしょうか?もしそうなら、その理由についての洞察を提供してください。

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
方向独立変数による正規分布DVの関連付けのテスト?
正規分布従属変数が方向分布変数に関連付けられているかどうかの仮説検定はありますか? たとえば、時刻が説明変数である場合(そして、曜日、月などのようなものは無関係であると想定)、つまり、午後11時が午前1時より 22時間進んでいること、および2が2 であることを説明する方法です。時間の背後にある関連のテストで午前1時?真夜中の12:00が午後11:59の1分後に続かないと仮定せずに、連続した時刻が従属変数を説明するかどうかをテストできますか? このテストは、離散方向(モジュラー)の説明変数にも適用されますか?それとも別のテストが必要ですか?たとえば、従属変数が月によって説明されるかどうかをテストする方法(日と季節、および特定の年または10年は無関係であると想定)。年の月を処理すると、順序は無視されます。ただし、月を標準の序数変数として扱う(たとえば、Jan = 1 ... Dec = 12)と、1月が11月の2か月後に来ることは無視されます。

1
角度/円形データの回帰
私はターゲットが角度である学習問題を監督しました。ここで単純な回帰を行うと、モデルの360と1は遠くなりますが、実際にはそれらが近く、x座標とy座標を予測することは適切ではありません。そのような問題を行う適切な方法は何ですか?

2
「等間隔の」サンプルから始まるユニットディスクの回帰
ユニットディスク上の複雑な回帰問題を解決する必要があります。元の質問は興味深いコメントを集めましたが、残念ながら回答はありませんでした。それまでの間、この問題についてさらに多くのことを学びました。したがって、元の問題をサブ問題に分割して、今回の運が良かったかどうかを確認します。 ユニットディスク内の狭いリングに規則的に配置された40個の温度センサーがあります。 これらのセンサーは時間内に温度を取得します。ただし、時間の変動は空間の変動よりもはるかに小さいため、時間の変動を無視して問題を単純化し、各センサーが時間平均のみを与えると仮定します。これは、40のサンプル(各センサーに1つ)があり、繰り返しのサンプルがないことを意味します。 センサーデータから回帰曲面を作成したいと思います。回帰には2つの目標があります。T=f(ρ,θ)+ϵT=f(ρ,θ)+ϵT=f(\rho,\theta)+\epsilon 平均半径方向温度プロファイルを推定する必要があります。線形回帰では、平均温度面である面をすでに推定しているので、に関して面を統合するだけでよいのですよね?回帰に多項式を使用する場合、この手順は簡単なはずです。Tmean=g1(ρ)+ϵTmean=g1(ρ)+ϵT_{mean}=g_1(\rho)+\epsilonθθ\theta 放射状の温度プロファイルを推定する必要があります。これにより、各放射状の位置でます。T95=g2(ρ)+ϵT95=g2(ρ)+ϵT_{95}=g_2(\rho)+\epsilonP(T(ρ)&lt;T95(ρ))=.95P(T(ρ)&lt;T95(ρ))=.95P(T(\rho)<T_{95}(\rho))=.95 これら2つの目標を踏まえて、ユニットディスクの回帰にはどの手法を使用すればよいですか?もちろん、ガウスプロセスは一般的に空間回帰に使用されます。ただし、ユニットディスクの適切なカーネルの定義は簡単なものではないため、失う戦略だと思わない限り、物事を単純に保ち、多項式を使用したいと思います。ゼルニケ多項式について読みました。ゼルニケ多項式は周期的であるため、単位ディスクの回帰に適しているようです。θθ\theta モデルを選択したら、推定手順を選択する必要があります。これは空間回帰問題であるため、さまざまな場所でのエラーは相関させる必要があります。通常の最小二乗法は相関のないエラーを想定しているため、一般化された最小二乗法がより適切だと思います。gls標準R分布に関数がある場合、GLSは比較的一般的な統計手法のようです。しかし、私はGLSを使用したことがなく、疑問があります。たとえば、共分散行列をどのように推定しますか?少数のセンサーを使用したとしても、うまくいった例は素晴らしいでしょう。 PS私はゼルニケ多項式とGLSを使用することを選択しました。これは、ここで行うのが論理的であるように思えるためです。ただし、私は専門家ではありません。私が間違った方向に進んでいると感じた場合は、完全に異なるアプローチを自由に使用してください。

1
方向ベクトルのコサインのモーメント/ mgf?
誰かが互いに独立してとして分布する2つのガウスランダムベクトルの余弦の2次モーメント(またはモーメント生成関数全体)を計算する方法を誰かが提案できますか?IE、次の確率変数の瞬間x,yx,yx,yN(0,Σ)N(0,Σ)\mathcal N (0,\Sigma) ⟨x,y⟩∥x∥∥y∥⟨x,y⟩‖x‖‖y‖\frac{\langle x, y\rangle}{\|x\|\|y\|} 最も近い質問は、内積の MGFを導出する2つのガウスランダムベクトルの内積のモーメント生成関数です。この質問をサンプルの共分散行列の固有値の分布にリンクするmathoverflowからのこの回答もありますが、それらを使用して2次モーメントを計算する方法はすぐにはわかりません。 私は2次元の代数的操作と、推測とチェックから3次元の結果を得るので、2次モーメントは\ Sigmaの固有値の半分のノルムに比例してスケーリングするΣΣ\Sigmaと思います。固有値a,b,ca,b,ca,b,c合計が1になると、二次モーメントは次のようになります。 (a−−√+b√+c√)−2(a+b+c)−2(\sqrt{a}+\sqrt{b}+\sqrt{c})^{-2} 数値チェックに以下を使用 val1[a_, b_, c_] := (a + b + c)/(Sqrt[a] + Sqrt[b] + Sqrt[c])^2 val2[a_, b_, c_] := Block[{}, x := {x1, x2, x3}; y := {y1, y2, y3}; normal := MultinormalDistribution[{0, 0, 0}, ( { {a, 0, 0}, …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.