タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

1
正規分布曲線の高さ
正規分布の「ベル型」曲線の場合、高さには理想的な値が必要であると考えられていました。この値を知ることは、データが正常に配布されているかどうかを確認するための1つの迅速な指標になる場合があります。 しかし、その正式な価値を見つけることができませんでした。ほとんどの場所で、形状は表示されますが、y軸の測定値は表示されません。http://www.stat.yale.edu/Courses/1997-98/101/normal.htm それが言及されているいくつかのグラフでは、それは0.4です。http://en.wikipedia.org/wiki/File:Normal_Distribution_PDF.svg。しかし、メインページ(http://en.wikipedia.org/wiki/Normal_distribution)では、0.4という値はどこにも言及されていません。 これは正しい値ですか、その数学的根拠は何ですか?あなたの洞察をありがとう。 編集: @Glen_bの回答とwikiページ(mean = 0)に示されている3つの曲線の平均は同じですが、SDは異なります。すべてのテストは、それらの間に有意差がないことを示します。しかし、それらは明らかに異なる集団からのものです。2つの分布の標準偏差の違いを判断するために、どの検定を適用できますか? ネットで調べたところ、F検定であることがわかりました。 しかし、平均が0で標準偏差が1である(およびピークが0.4である)分布曲線に類似した特定の名前はありますか? コメントでAleksandr Blekhが回答:「N(0,1)で示される標準正規分布または単位正規分布」。 ただし、平均が異ならない場合は、F検定またはKS検定(コメントでGlen_bが示唆)を実行して、標準偏差が異なり、母集団が異なるかどうかを判断する必要があることは強調されません。

3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

2
カイ二乗から正規分布への変換
標準正規分布とカイ2乗分布の関係はよく知られています。でも、 から標準正規分布に戻る変換はあるのでしょうか。χ2(1)χ2(1)\chi^2 (1) その範囲は正の数値のみであるため、平方根変換が機能しないことが簡単にわかります。結果の分布は、折りたたまれた正規分布と呼ばれていると思います。ここで機能する巧妙なトリックはありますか?

2
通常のマージンと指定された(ピアソン)相関による条件付き期待値の制限
別のフォーラムで次の質問を見ました。 「成人男性の身長と体重の両方が通常のモデルで説明でき、これらの変数間の相関が0.65であると仮定します。男性の身長が彼を60パーセンタイルに配置する場合、彼の体重はどのパーセンタイルであると予想しますか?」 問題のフォーラムの誰かが、質問はマージンが正常(height and weight ... can be described with normal models)であり、2変量の正常性について話しており、質問に単一の答えがないことをすでに指摘していることを私は知っています。 明らかに、答えは実際の2変量依存関係(コピュラ)に依存します。 私の質問は: 通常のマージンと指定された母集団相関(ρρ\rho、ピアソン相関)が与えられた場合、X とYの両方が正規であり、相関ρがある場合、境界を見つけるのに適度に簡単な方法はありますか?E(Y| バツ= xq)E(Y|X=xq)E(Y|X=x_q)バツ、YX,YX,Yρρ\rho 条件付き期待値の正確な最大値と最小値がある場合、それ(および優先的には、それぞれが発生する状況*)を知っておくとよいでしょう。 *私はそれらの状況がどうなるかについて強い疑いを抱いています(つまり、関与する可能性のある依存の種類。特に、特定の種類の縮退分布が範囲を与えることを期待します)。深さ。(私は誰かがすでにそれを知っている可能性が高いと思います。) それができない場合、最大値と最小値の両方の上限または下限が興味深いでしょう。 代数的な答えはいいでしょうが、私は代数的な答えを必ずしも必要としません(いくつかのアルゴリズムはそうするでしょう)。 概算または部分的な回答が役立つ/役立つ場合があります。 誰も良い答えを持っていない場合、私はそれを自分で試してみるかもしれません。

2
ガウス分布の
この質問は、次の質問から続いています。 /math/360275/e1-1x2-under-a-normal-distribution 基本的に、一般的なガウス下でのは何。をガウスのスカラー混合として書き直してみました()。これはまた、皆さんがあなたのベルトの下にトリックを持っているのでない限り、止まりました。E(11+x2)E(11+x2)E\left(\frac{1}{1+x^2}\right)N(μ,σ2)N(μ,σ2)\mathcal{N}(\mu,\sigma^2)11+x211+x2\frac{1}{1+x^2}∝∫N(x|0,τ−1)Ga(τ|1/2,1/2)dτ∝∫N(x|0,τ−1)Ga(τ|1/2,1/2)dτ\propto \int\mathcal{N}(x|0,\tau^{-1})Ga(\tau|1/2,1/2)d\tau この積分が分析的でない場合、賢明な範囲はありますか?

2
通常の切り捨てられた確率変数の合計
私が持っていると仮定しの独立した正規確率変数んnn バツ1〜N(μ1、σ21)バツ2〜N(μ2、σ22)⋮バツん〜N(μん、σ2ん)X1∼N(μ1,σ12)X2∼N(μ2,σ22)⋮Xn∼N(μn,σn2)X_1 \sim \mathrm{N}(\mu_1, \sigma_1^2)\\X_2 \sim \mathrm{N}(\mu_2, \sigma_2^2)\\\vdots\\X_n \sim \mathrm{N}(\mu_n, \sigma_n^2) および。各の分布がそれぞれ内に切り捨てられている場合、の密度をどのように特徴付けますか?つまり、独立した正規分布からサンプリングし、各平均の内にないサンプルを破棄して、それらを合計しています。 Y X I(μ I - 2 σ I、μ I + 2 σ I)N 2 σ IY= X1+ X2+ ⋯ + XんY=X1+X2+⋯+XnY=X_1+X_2+\dotsm+X_nYYYバツ私XiX_i(μ私- 2 σ私、μ私+ 2 σ私)(μi−2σi,μi+2σi)(\mu_i - 2\sigma_i, \mu_i + 2\sigma_i)んnn2つのσ私2σi2\sigma_i 現在、私は以下のRコードでこれを行っています: x_mu <- c(12, 18, 7) x_sd <- …

2
正規母集団の小さなサンプルのサンプリング分布は正規ですか、それともt分布ですか?[閉まっている]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 5年前休業。 母集団が正規分布していることを知っていて、この母集団から小さなサンプルを取得する場合、サンプリング分布が正常であるか、または代わりにt分布に従うと主張する方が正しいですか? 小さなサンプルはt分布する傾向があることを理解していますが、これは、基になる人口分布が不明な場合にのみ適用されますか? ありがとう!

2
多変量ガウス対数尤度の勾配
勾配降下法でモデルのMAP推定値を見つけようとしています。私の以前は、既知の共分散行列をもつ多変量ガウスです。 概念的なレベルでは、私はこれを行う方法を知っていると思いますが、詳細についていくつかの助けを求めていました。特に、問題に対処する簡単な方法がある場合、それは特に役立ちます。 ここでは、私が何だと思う私は実行する必要があります。 各次元について、他の次元での現在の位置を指定して、条件付き分布を見つけます。 これにより、正しい平均と標準偏差を使用して、各次元の局所的な一変量ガウス分布が得られます。 勾配は、これらの単変量分布のそれぞれの導関数のベクトルである必要があると思います。 私の質問には2つの部分があります。 これは最善のアプローチですか、それとももっと簡単な方法がありますか? このルートに行く必要があると仮定すると、これらの条件付き分布を見つけるための最良の方法は何ですか?

2
(K-平均)クラスタリング手法で平均値のみが使用されるのはなぜですか?
K-meansなどのクラスタリング手法では、ユークリッド距離が使用するメトリックです。結果として、各クラスター内の平均値のみを計算します。そして、各平均値までの距離に基づいて要素が調整されます。 ガウス関数がメトリックとして使用されないのはなぜですか?を使用する代わりにxi -mean(X)、を使用できますexp(- (xi - mean(X)).^2/std(X).^2)。したがって、クラスター間の類似性が測定されるだけでなく(平均)、クラスター内の類似性も考慮されます(標準)。これもガウス混合モデルと同等ですか? ここでは私の質問を超えていますが、平均シフトは上記と同じ質問が発生する可能性があると思います。


2
残差の非正規性
残差の正規分布の重要性に疑問を呈するように見えるこの投稿を参照します。これは、不均一分散とともに、ロバストな標準誤差を使用することで回避できる可能性があると主張しています。 私はさまざまな変換(ルート、ログなど)を検討しましたが、すべて問題を完全に解決するのに役に立たないことがわかりました。 これが私の残差のQQプロットです。 データ 従属変数:すでに対数変換を使用(このデータの外れ値の問題と歪度の問題を修正) 独立変数:会社の年齢、およびいくつかのバイナリ変数(指標)(後で、独立変数として別の回帰のためにいくつかのカウントがあります) iqrStata のコマンド(Hamilton)は、正規性を除外する重大な外れ値を特定しませんが、下のグラフはそうでないことを示唆しており、Shapiro-Wilkテストもそうです。

1
Royモデルの2変量標準正規および暗黙条件付き確率の特性
長いタイトルで申し訳ありませんが、私の問題はかなり具体的であり、1つのタイトルで説明するのは困難です。 私は現在ロイモデル(治療効果分析)について学んでいます。 私のスライドには、1つの導出ステップがありますが、これは理解できません。 治療群での治療の予想結果を計算します(ダミーDは治療か非治療か)。これは E[Y1|D=1]E[Y1|D=1]\begin{align} E[Y_1|D=1] \end{align} 以来、このように書き換えることができる E [ Y 1 | D = 1 ]Y1=μ1+U1Y1=μ1+U1Y_1=\mu_1 + U_1 についても説明しましたが、Y1>Y0の場合、 D=1となるため、次のようになります。E[Y1|D=1]=E[μ1+U1|D=1]=μ1+E[U1|D=1]E[Y1|D=1]=E[μ1+U1|D=1]=μ1+E[U1|D=1]\begin{align} E[Y_1|D=1] &= E[\mu_1+U_1|D=1]\\ &=\mu_1+ E[U_1|D=1] \end{align}D=1D=1D=1Y1>Y0Y1>Y0Y_1>Y_0 Y1−Y0>0Y1−Y0>0Y_1-Y_0>0 μ1+U1−(μ0−U0)>0μ1+U1−(μ0−U0)>0\mu_1+U_1-(\mu_0-U_0)>0 (μ1+U1)/σ−(μ0−U0)/σ>0(μ1+U1)/σ−(μ0−U0)/σ>0(\mu_1+U_1)/\sigma-(\mu_0-U_0)/ \sigma >0 Z−ϵ>0Z−ϵ>0Z-\epsilon>0 したがって、ϵ < Zの場合、D=1D=1D=1ϵ<Zϵ<Z\epsilonc)=E[\rho u_2|u_2>c]=\rho E[u_2|u_2>c)=\rho\frac{\phi(c)}{1-\Phi(c)} σ1 ϵσ1ϵ\sigma_{1\epsilon}ρρ\rho μ1− E[ U1| ϵ<Z] = μ1+ ρ φ (Z)Φ (Z)μ1−E[U1|ϵ<Z]=μ1+ρϕ(Z)Φ(Z)\begin{align} …

1
多変量正規分布と分類の一般化
期待値および共分散行列と単調減少関数密度が 、ここで はマハラノビス距離です。もちろん、多変量法線はによって回復されます。 ΣG(D)P( → X)αG(Δ( → X、 → μ))Δ( →、 → B)=√μ⃗ μ→\vec \muΣΣ\Sigmag(d)g(d)g(d)p (x⃗ )∝ g( Δ (x⃗ 、μ⃗ ))p(x→)∝g(Δ(x→,μ→)) p(\vec x) \propto g \left ( \Delta(\vec x, \vec \mu) \right ) G(D)=EXP(- 1Δ (a⃗ 、b⃗ )= (a⃗ − b⃗ )TΣ− 1(a⃗ − b⃗ )−−−−−−−−−−−−−−−√Δ(a→,b→)=(a→−b→)TΣ−1(a→−b→) \Delta(\vec a, \vec …

3
SPSSを使用した2x3混合設計ANOVAの事後テスト?
実験中に3回評価された10人の参加者の2つのグループがあります。グループ間および3つの評価全体の違いをテストするために、group(コントロール、実験)、time(最初、2、3)、およびを使用して2x3混合設計ANOVAを実行しましたgroup x time。両方timeとgroup有意な相互作用があったほか、重大な結果group x time。 グループメンバーシップに関しても、3回の評価の違いをさらにチェックする方法をよく知りません。実際、最初は、ANOVAのオプションで、ボンフェローニの補正を使用してすべての主要な効果を比較することだけを指定しました。しかし、この方法で、グループを区別せずに、サンプル全体の時間の違いをこのように比較したことに気付きましたね。 したがって、可能な解決策を見つけるためにインターネットでたくさん検索しましたが、結果はほとんどありませんでした。私と同じようなケースは2つしか見つかりませんでしたが、解決策は逆です! 記事では、混合設計の後、著者らは被験者ごとに1つずつ、2回の反復測定ANOVAを事後的に実行しました。このようにして、2つのグループは修正なしで個別に分析されます。 インターネットのガイドでは、混合ANOVAの実行中に、SPSS構文のCOMPARE(time) ADJ(BONFERRONI)直後にを手動で追加すると述べています/EMMEANS=TABLES(newgroup*time)。このように、3つの時間はグループごとに個別に比較されます。ボンフェローニ補正を使用すると、私は正しいのでしょうか。 どう思いますか?どちらが正しい方法でしょうか?
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 

1
部分空間の標準正規分布
ましょう有するベクトル空間である。上の標準正規分布ランダムベクトルの法則であるの値をとるとの座標ようにいずれかで(のいずれかにおいて)正規直交基底ランダムベクトルであります製の独立した標準正規分布。暗く(U )= D U X = (X 1、... 、X N)U XU⊂RnU⊂RnU \subset \mathbb{R}^ndim(U)=ddim⁡(U)=d\dim(U)=dUUUX=(X1,…,Xn)X=(X1,…,Xn)X=(X_1, \ldots, X_n)UUUXXX⟺⟺\iffD N(0 、1 )UUUdddN(0,1)N(0,1){\cal N}(0, 1) この質問を読んでいるとき、私は次の質問を自分に問いました。LET上の標準正規分布である。ですがの条件付き分布は事実である与え上の標準正規分布である?R N Y Y ∈ U UY=(Y1,…,Yn)Y=(Y1,…,Yn)Y=(Y_1, \ldots, Y_n)RnRn\mathbb{R}^nYYYY∈UY∈UY \in UUUU 二乗ノルムのXは、カイ二乗分布有し\カイ^ 2_dを。したがって、これが真実であれば、それは@Arghaの主張を説明することになります。 X χ 2 D∥X∥2‖X‖2{\Vert X \Vert}^2XXXχ2dχd2\chi^2_d LaTeXのタイプが間違っていると申し訳ありませんが、LaTeXのレンダリングが表示されません:( 編集01/10/2012:わかりました。書き込みy=u+vy=u+vy=u+vの直交decompostion yyyにおけるU⊕U⊥U⊕U⊥U\oplus U^\perp。次に、Pr(Y∈dy∩Y∈U)=Pr(PUY∈du)Pr(Y∈dy∩Y∈U)=Pr(PUY∈du)\Pr(Y\in \mathrm{d}y \cap Y \in U)=\Pr(P_U Y \in …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.