タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

5
正規分布の百分位数の計算
このウィキペディアのページをご覧ください: http://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Agresti-Coull_Interval Agresti-Coull Intervalを取得するには、と呼ばれる正規分布のパーセンタイルを計算する必要があります。パーセンタイルを計算するにはどうすればよいですか?Wolfram MathematicaやPython / NumPy / SciPyでこれを行う既成の関数はありますか?zzz

2
誰かが私に対数正規分布のパラメーターを説明できますか?
私はいくつかの読書をしていますが、これはDeGrootの本から得た定義です。 それはパラメータが同じであることを意味しますか?たとえば、Xが対数正規分布で、Yが正規分布であると仮定します。ここで、Y = log(X)です。これは、XとYの形状分布が異なっていても、平均とSDは同じであるということですか?そうでない場合、μとσはどの分布を指しますか? つまり、Xが平均μとSDσで対数正規分布していると誰かが言った場合、平均とSDが正規項になるように変換する必要がありますか?

1
方向ベクトルのコサインのモーメント/ mgf?
誰かが互いに独立してとして分布する2つのガウスランダムベクトルの余弦の2次モーメント(またはモーメント生成関数全体)を計算する方法を誰かが提案できますか?IE、次の確率変数の瞬間x,yx,yx,yN(0,Σ)N(0,Σ)\mathcal N (0,\Sigma) ⟨x,y⟩∥x∥∥y∥⟨x,y⟩‖x‖‖y‖\frac{\langle x, y\rangle}{\|x\|\|y\|} 最も近い質問は、内積の MGFを導出する2つのガウスランダムベクトルの内積のモーメント生成関数です。この質問をサンプルの共分散行列の固有値の分布にリンクするmathoverflowからのこの回答もありますが、それらを使用して2次モーメントを計算する方法はすぐにはわかりません。 私は2次元の代数的操作と、推測とチェックから3次元の結果を得るので、2次モーメントは\ Sigmaの固有値の半分のノルムに比例してスケーリングするΣΣ\Sigmaと思います。固有値a,b,ca,b,ca,b,c合計が1になると、二次モーメントは次のようになります。 (a−−√+b√+c√)−2(a+b+c)−2(\sqrt{a}+\sqrt{b}+\sqrt{c})^{-2} 数値チェックに以下を使用 val1[a_, b_, c_] := (a + b + c)/(Sqrt[a] + Sqrt[b] + Sqrt[c])^2 val2[a_, b_, c_] := Block[{}, x := {x1, x2, x3}; y := {y1, y2, y3}; normal := MultinormalDistribution[{0, 0, 0}, ( { {a, 0, 0}, …

2
内の完全な統計
統計が完了しているかどうかを知りたい以下のためのにおけるの設定。 σ2N(μ、σ2)T(X1,…,Xn)=∑ni=1(Xi−X¯n)2n−1T(X1,…,Xn)=∑i=1n(Xi−X¯n)2n−1T(X_1,\ldots,X_n)=\frac{\sum_{i=1}^n (X_i-\bar{X}_n)^2}{n-1}σ2σ2\sigma^2N(μ 、σ2)N(μ,σ2)N(\mu,\sigma^2) これは、が以前に知られているかどうかに依存しますか?がに対して完全である場合、Lehmann-SchefféによってUMVUEになります。しかし、がわかっている場合は、と見なすことができその分散はCramer-Raoはにバインドされており、厳密に未満であるため、 UMVUEにすることはできません。T σ 2μμ\muTTTσ2σ2\sigma^2W (X 1、... 、XのN)= Σ N I = 1(X I - μ )2μμ\mu2σ4/N2σ4/(N-1)=Varの[T]TW(X1、… 、Xん)= ∑んi = 1(X私- μ )2ん、W(X1,…,Xn)=∑i=1n(Xi−μ)2n,W(X_1,\ldots,X_n)=\frac{\sum_{i=1}^n (X_i-\mu)^2}{n},2つのσ4/ n2σ4/n2\sigma^4/n2つのσ4/(n−1)=Var[T]2σ4/(n−1)=Var[T]2\sigma^4/(n-1)=\text{Var}[T]TTT

2
なぜ確率分布はここで増加するのですか?
ましょXXX例えば、ライブに残り日数のあなたの番号です。医者1件の評価さの分布XXXガウシアンとして:P(X)∼N(μ1,σ1)P(X)∼N(μ1,σ1)P(X)\sim\mathcal{N}(\mu_1,\sigma_1)。別の独立した医師2件の評価さP(X)∼N(μ2,σ2)P(X)∼N(μ2,σ2)P(X)\sim\mathcal{N}(\mu_2,\sigma_2)。どちらの医師も同等に信頼できます。両方の情報を組み合わせる方法は? で、このブログの記事で、著者はと言います 2つの確率があり、両方が真である可能性を知りたい場合は、それらを乗算します。したがって、2つのガウスblobを取得して乗算します。 編集ほとんどの人は(私が最初math.SEにこの質問をした)、これは些細な独立の関係であると答えているが、私はまだ難し何だろう理解が午前AとBをこの状況にあること:おそらく「サイコロは3を与える」または「患者は病気です」などのイベントではありません。2つの密度の積は、一般的にので、確率密度はないので、また、より多くの何かが、おそらくある∫ R P (X )2 ≠ 1P(A∩B)=P(A)P(B)P(A∩B)=P(A)P(B)P(A\cap B)=P(A)P(B)AAABBB∫RP(x)2≠1∫RP(x)2≠1\int_\mathbb{R} P(x)^2 \neq 1。したがって、それはおそらくそれほど単純ではありません。 別の例を見てみましょう。エキスパート1は、サイコロが完全にバランスが取れていると言います。別の専門家2は、独立して同じようにあなたに言います。次いで3を与えるサイコロの確率は確かではない。1/621/621/6^2

2
ガウス確率変数の最大値の分散
ランダム変数からサンプリングされた、定義します X1,X2,⋯,XnX1,X2,⋯,XnX_1,X_2, \cdots, X_n∼N(0,σ2)∼N(0,σ2)\sim \mathcal{N}(0, \sigma^2)Z=maxi∈{1,2,⋯,n}XiZ=maxi∈{1,2,⋯,n}XiZ = \max_{i \in \{1,2,\cdots, n \}} X_i 我々は、そのE[Z]≤σ2logn−−−−−√E[Z]≤σ2log⁡n\mathbb{E}[Z] \le \sigma \sqrt{2 \log n}。\ text {Var}(Z)に上限/下限があるかどうか疑問に思っていましたかVar(Z)Var(Z)\text{Var}(Z)?

4
二項分布の正規近似:なぜnp> 5?
二項分布の正規近似について説明しているほぼすべての教科書は、および場合に近似を使用できるという経験則に言及しています。一部の書籍では、代わりにをます。同じ定数は、 -testでセルをマージするタイミングの説明によく現れます。私が見つけたテキストはどれも、この経験則の正当化または参照を提供していません。N (1 - P )≥ 5 N P (1 - P )≥ 5 5 χ 2np≥5np≥5np\geq5n(1−p)≥5n(1−p)≥5n(1-p)\geq 5np(1−p)≥5np(1−p)≥5np(1-p)\geq 5555χ2χ2\chi^2 この定数5はどこから来たのですか?なぜ4または6または10ではないのですか?この経験則はもともとどこに導入されたのですか?

2
Rの下限または上限で制約付き法線をシミュレート
Rを使用して制約付き正規分布からランダムデータを生成したいと思います。 たとえば、正規分布の変数をシミュレートしたいmean=3, sd= 2とします。5より大きい値はすべて同じ正規分布からリサンプリングされます。 したがって、一般的な機能については、次のことができます。 rnorm(n=100, mean=3, sd=2) それから私はいくつかの考えを持っていました: ifelseすべての値が境界内に収まるように制約されるまで繰り返すループで関数を反復します。 必要以上に多くの値をシミュレートしn、制約を満たす最初の値を取ります。 ベクトル化された通常の変数シミュレーターを避け、代わりに内部のdoでforループを使用して、各観測を一度に1つずつシミュレーションし、必要に応じてループします。 上記のすべては少し不格好に見えます。 質問 平均= 3、sd = 2、最大= 5の法線からRの制約付きランダム正規変数をシミュレートする簡単な方法は何ですか? より一般的には、Rのシミュレートされた変数に制約を組み込む一般的な方法は何ですか

2
ガウス関数はどこから来たのですか?
私はグーグルで無数のページを読みました、そして満足な答えを見つけることができません。私もhttp://castatistics.wikispaces.com/file/view/normal+der..pdfを読みましたが、それがガウス関数の元々の動機であったとは思えません。私は現在学部生であり、私の教科書では、関数f(x)= ae-(x-b)^ 2 / cが正規曲線の確率密度関数として使用されていると説明しています。しかし、私の教科書には、この機能が実際にどこから来たのかについての手がかりはありません。そのような機能を開発する当初の動機は何でしたか?誰かが、明確にラベル付けされたステップで実際に理解できる証拠を提示してくれませんか?私は基本的な微積分の理解があり、統計に関しては初心者です。複雑な証明はしないでください。

4
低差異シーケンスを正規分布に変換するための最良の方法?
私はそれらのプロパティが有用であることを発見したので、しばらくの間、不一致の少ないシーケンスを均一分布に使用してきました(主にコンピュータグラフィックスでランダムな外観とインクリメンタルな方法で[0,1]を密にカバーする能力)。 たとえば、上記のランダム値、以下のHaltonシーケンス値: いくつかの財務分析計画にそれらを使用することを検討していましたが、均一な分布とは異なる分布が必要です。Marsaglia極アルゴリズムを介して均一分布から正規分布を生成することから始めましたが、結果は均一分布の場合ほど良くありません。 別の例、上でランダム、下のハルトン: 私の質問は次のとおりです。カバレッジ、インクリメンタルフィルイン、複数の次元にわたる非相関など、均一な低い不一致シーケンスから取得するプロパティを使用して正規分布を取得するための最良の方法は何ですか?私は正しい軌道に乗っていますか、それともまったく異なるアプローチをとるべきですか? (上記で使用している均一および正規分布のPythonコード:Gist 2566569)

2
k-meansは非正規分布データに使用できますか?
アイリスデータセットのように通常は分散されない多くのデータセットを使用してk平均法をテストする多くの論文を読み、良い結果を得ました。k平均法は正規分布データ用であると理解しているので、なぜ非正規分布データ用にk平均法が使用されているのですか? たとえば、以下の論文では、正規分布曲線に基づいてk平均から重心を修正し、正規分布されていない虹彩データセットを使用してアルゴリズムをテストしました。 ほとんどすべてのインライア(正確には99.73%)は、母平均から3標準偏差(𝜎)以内の点から重心までの距離を持ちます。 ここで理解できないことはありますか? Olukanmi&Twala(2017)。K-means-sharp:外れ値にロバストなk-meansクラスタリングのための変更されたセントロイド更新 アイリスデータセット

2
混合ガウスモデルを使用する理由
私は混合ガウスモデル(GMM)について学習していますが、なぜこのアルゴリズムを使用する必要があるのか​​について混乱しています。 このアルゴリズムは、クラスタリングに関して、平均などの他の標準的なクラスタリングアルゴリズムよりもどのように優れていますか?手段は、パーティションにデータを、アルゴリズムガウス混合モデルは、各データポイントの明確なセットのメンバーシップを生成しないのに対し、明確なセットのメンバーシップとクラスター。GMMを使用して、あるデータポイントが別のデータポイントに近いと言う指標は何ですか?KKKKKKKKK GMMが生成する最終的な確率分布をどのように利用できますか?最終確率分布を取得するとします。ここで、は重みです。データ適合する確率分布を取得しました。どうすればよいですか?f(x | w )f(バツ|w)f(x|w)wwwバツバツx 以下のために、私の前の時点でフォローアップする手段、終了時に、我々は一連の取得我々は集合として表すことができるクラスター、であり、ものを。しかし、GMMのために、私は得るすべてが1つの配布であるである1つの事。これをKクラスターにクラスター化するためにどのように使用できますか?KKKKKK{S1、… 、SK}{S1、…、SK}\{S_1, \ldots, S_K\}KKKf(x | w )=Σi = 1Nw私N(x |μ私、Σ私)f(バツ|w)=Σ私=1Nw私N(バツ|μ私、Σ私)f(x|w) = \sum\limits_{i=1}^N w_i \mathcal{N}(x|\mu_i, \Sigma_i)111KKK

3
正規分布
残念ながら、どこから始めればよいかわからないという統計上の問題があります(私は独力で勉強しているので、何かがわからなければ、誰にも尋ねることができません。 質問は iid N (a 、b 2); a = 0 ; b 2 = 6 ; v a r (X 2 + Y 2)= ?バツ、YX,YX,YN(a 、b2); a = 0 ; b2= 6 ; v a r (X2+ Y2)= ?N(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b^2); a=0; b^2=6; var(X^2+Y^2)=?

1
分布を制限しています
ましょう(Xn)(バツん)(X_n) IIDの配列であるN(0,1)N(0、1)\mathcal N(0,1)ランダム変数。定義S0=0S0=0S_0=0及びSn=∑nk=1XkSn=∑k=1nXkS_n=\sum_{k=1}^n X_kためのn≥1n≥1n\geq 1。1の極限分布を見つける1n∑k=1n|Sk−1|(X2k−1)1n∑k=1n|Sk−1|(Xk2−1)\frac1n \sum_{k=1}^{n}|S_{k-1}|(X_k^2 - 1) この問題は、中心極限定理の章にある、確率論の問題集にあります。 以降Sk−1Sk−1S_{k-1}とXkXkX_k、独立しているE(|Sk−1|(X2k−1))=0E(|Sk−1|(Xk2−1))=0E(|S_{k-1}|(X_k^2 - 1))=0とV( | Sk − 1|(X2k− 1 ))= E(S2k − 1(X2k− 1 )2)= E(S2k − 1)E(X2k− 1 )2)= 2 (k − 1 )V(|Sk−1|(バツk2−1))=E(Sk−12(バツk2−1)2)=E(Sk−12)E(バツk2−1)2)=2(k−1)V(|S_{k-1}|(X_k^2 - 1)) = E(S_{k-1}^2(X_k^2 - 1)^2)= E(S_{k-1}^2)E(X_k^2 - 1)^2) =2(k-1) ことに注意してください| Sk − 1| (X2k− 1 )|Sk−1|(バツk2−1)|S_{k-1}|(X_k^2 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.