タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

2
ポアソン分布を正規分布に変換
私は主にコンピューターサイエンスのバックグラウンドを持っていますが、今は自分自身に基本的な統計を教えようとしています。ポアソン分布があると思うデータがあります 2つの質問があります。 これはポアソン分布ですか? 次に、これを正規分布に変換することは可能ですか? 任意の助けいただければ幸いです。どうもありがとう

4
2次元の標準偏差を計算する方法。
私の問題は次のとおりです。床から数メートル離れた特定の場所から一度に40個のボールを落とします。ボールが転がり、休憩します。コンピュータービジョンを使用して、XY平面の重心を計算します。単純なジオメトリを使用して計算された、重心から各ボールまでの距離のみに関心があります。さて、中心からの片側標準偏差を知りたい。したがって、特定の数のボールが1つの標準半径内にあり、より多くのボールが2 *標準半径内にあることなどを知ることができます。片側標準偏差を計算するにはどうすればよいですか?通常のアプローチでは、ボールの半分が0の「負の側」にあると述べています。もちろん、これはこの実験では意味がありません。ボールが標準分布に準拠していることを確認する必要がありますか?助けてくれてありがとう

4
Rの離散時間イベント履歴(生存)モデル
Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。 従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります:ID、Event(各time-obsで1または0)およびTime Elapsed(観測の開始以降)、および他の共変量。 モデルに合うようにコードを書くにはどうすればよいですか?従属変数はどれですか?Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか?必要ですか? ありがとう。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R線形回帰のカテゴリ変数「非表示」の値
これは私が何度か遭遇した例にすぎないため、サンプルデータはありません。Rで線形回帰モデルを実行する: a.lm = lm(Y ~ x1 + x2) x1は連続変数です。x2カテゴリ型で、「低」、「中」、「高」の3つの値があります。ただし、Rによって与えられる出力は次のようになります。 summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 私は、Rがそのような要因(要因x2であること)に何らかのダミーコーディングを導入していることを理解しています。私はただ疑問に思っていx2ます。「高」の値をどのように解釈しますか?たとえば、ここで示した例の「High」x2は応答変数にどのような影響を与えますか? これの例を他の場所(例:ここ)で見ましたが、理解できる説明は見つかりませんでした。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
ガウス効率とはどういう意味ですか?
堅牢な推定量の場合、ガウス効率とはどういう意味ですか?たとえば、は82%のガウス効率と50%のブレークダウンポイントを持っています。QんQんQ_{_n} 参照は次のとおりです:Rousseeuw PJおよびCroux、C.(1993)。「絶対偏差の中央値の代替案。」J. American Statistical Assoc。、88、1273-1283

2
ガウス混合モデルのコンポーネントは何ですか?
ガウス混合モデルのディメンションとコンポーネントの関係は何ですか?そして、寸法とコンポーネントの意味は何ですか?ありがとうございました。 私が間違っている場合は修正してください:私の理解は、観測されたデータには多くの次元があることです。各次元は、収集されたデータの特徴/側面を表し、独自のガウス分布を持っています。「コンポーネント」がこの図のどこに当てはまるのか、そしてそれが何を意味するのかわかりません。

2
2つの信号が一緒に正規分布しているかどうかを確認するにはどうすればよいですか?
このウィキペディアのページで説明されているように、2つの確率変数XとYが無相関で、一緒に正規分布している場合、それらは統計的に独立しています。 XとYが相関しているかどうかを確認する方法を知っていますが、それらが一緒に正規分布しているかどうかを確認する方法がわかりません。私は統計をほとんど知りません(数週間前に正規分布が何であるかを学びました)ので、いくつかの説明的な答え(そしておそらくチュートリアルへのリンク)が本当に役立つでしょう。 だから私の質問はこれです:2つの信号を有限回数N回サンプリングした場合、2つの信号サンプルが一緒に正規分布しているかどうかを確認するにはどうすればよいですか? 例:次の画像は、2つの信号s1とs2の推定された同時分布を示しています。 x=0.2:0.2:34; s1 = x*sawtooth(x); %Sawtooth s2 = randn(size(x,2)); %Gaussian ジョイントpdfは、この2Dカーネル密度推定器を使用して推定されました。 画像から、接合部pdfがほぼ原点を中心とする丘のような形状であることがわかります。これは、それらが実際に共同で正規分布していることを示していると思います。ただし、数学的に確認する方法を教えてください。使用できる数式はありますか? ありがとうございました。

5
境界領域上の正規のような分布
ガウス(正規)分布に似ているが、定義されたセグメントでのみ確率密度が非ゼロになるような分布はありますか。 サークル内の「弾丸の広がり」をモデル化しようとしたときに問題が浮上しました。ガウス分布は正常に機能しますが、弾丸が円の外側に当たる可能性は常にあります。ガウス分布に非常に似ている分布を見つけたいのですが、定義されたセグメント(または円)の外側の確率がゼロであるという特性があります。 編集:はい、実際には円ではなくディスクを意味します。編集:そしてはい、私は(ディスクの半径に沿った)1次元の分布のみが必要です。これは円対称になります(角度に依存しません)。

1
0打ち切り多変量正規分布の平均と分散は何ですか?
してみましょうZ∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma)であることRdRd\mathbb R^d。の平均と共分散行列は何ですかZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z)(最大値は要素ごとに計算されます)? たとえば、ディープネットワーク内でReLUアクティベーション機能を使用し、CLTを介して、特定のレイヤーへの入力がほぼ正常であると想定すると、これが出力の分布になります。 (多くの人がこれを以前に計算したことがあると私は確信しているが、合理的に読みやすい方法でどこにもリストされている結果を見つけることができなかった。)



1
二次形式の法線の分布
の分布を把握しようとしています ここで、、にとると、 および (*)の分布については不明です(n−1)∑i=1nZ2i−(∑i=1nZi)2(∗)(n−1)∑i=1nZi2−(∑i=1nZi)2(∗) (n-1) \sum_{i=1}^n Z_i^2 - \left( \sum_{i=1}^n Z_i \right)^2 \qquad (*) Zi∼N(0,1)Zi∼N(0,1)Z_i \sim \mathcal{N}(0,1)∑i=1nZ2i∼χ2(n)∑i=1nZi2∼χ2(n) \sum_{i=1}^n Z_i^2 \sim \chi^2(n) 1n(∑i=1nZi)2∼χ2(1).1n(∑i=1nZi)2∼χ2(1). \frac{1}{n}\left( \sum_{i=1}^n Z_i \right)^2 \sim \chi^2(1).

1
経験的測定値の「正規分布を仮定した」と書いてもよいですか。
人口などの生物医学的量の測定が通常の「ベルカーブ」に従うことは、医学などの応用分野の教育に根付いています。文字列のA Google検索「我々は正規分布と仮定」リターンをの結果を!気候変動に関する研究では、「極端なデータポイントの数が少ない場合は、温度異常の正規分布を想定した」ように聞こえます。または、ペンギンに関する異論の少ない可能性のある文書で「ニワトリの孵化日の正規分布を仮定した」。または 「GDP成長ショックの正規分布を想定」、23,90023,900\small 23,900、 ... と他のこと)。 最近、私はカウントデータの厳密に肯定的な性質のために正規分布としての扱いに疑問を感じました。もちろん、カウントデータは離散的であるため、正規性はさらに人為的になります。しかし、この後者の点を別にしても、原型的に「連続的」と見なされる、グルコースの重量、高さ、または濃度などの連続的な経験的測定が正常と見なされるのはなぜですか?カウントがする以上に否定的な実現観察はあり得ません! 標準偏差が平均より大幅に低く、負の値がほとんどない場合( "95%範囲チェック")、それは実際的な仮定である可能性があり、頻度ヒストグラムが歪んでいない場合はそれをサポートします。しかし、質問は些細なことのように思われませんでした、そして迅速な検索は興味深いものを見つけました。 で自然我々は、上の次のステートメントを見つけることができDFヒースによって手紙を:「私は特定のタイプのデータの統計的分析のためのデータを正規母集団から引き出されていることを仮定は通常間違っている、との代替ということを指摘したいです対数正規分布の仮定の方が優れています。この代替手段は統計学者、経済学者、物理学者に広く使用されていますが、他の分野の科学者には何らかの理由で無視されることがよくあります。」 Limpertは、「対数正規モデルは、現在多くの科学者が正規を有効な近似として認識しているという意味での近似として機能する可能性がある」と述べ、正規性の適合度テストの低い検出力と選択の難しさを指摘しています。小さなサンプルを扱う場合、経験的に正しい分布。 したがって、問題は「応用科学の実証的測定値の正規分布をさらに裏付けとなる証拠なしに仮定することはいつ受け入れられるのか」ということです。そして、なぜ対数正規のような他の代替案が、なぜ、そしておそらくおそらく定着しないのでしょうか?


1
自然界のプロセスはまったく正常に分散されていますか?
自然界における正規分布の重要性については多くのことが言われてきました。身長や体重のような多くの測定値は、ほぼ正常に分布しています。しかし、私が理解している限り、それらのどれも正確に正常ではありません。 正規分布は最大エントロピー分布の 1つであることを考えると、自然が「好き」であるべきだと考えられます。しかし、いくつか考えた結果、「本当に」通常の確率変数の例を思い付くことができませんでした。 私の質問は、そこに正確に正規分布された確率変数の良い例は何ですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.