タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

1
従属変数をログ変換しました。LOGリンク機能でGLM正規分布を使用できますか?
一般化線形モデル(GLM)について質問があります。私の従属変数(DV)は連続的で、正常ではありません。だから私はそれをログに変換しました(まだ正常ではありませんが改善されました)。 DVを2つのカテゴリ変数と1つの連続共変数に関連付けます。このため、GLMを実施したい(私はSPSSを使用しています)が、選択する分布と機能をどのように決定するかわかりません。 Leveneのノンパラメトリック検定を実施し、分散の均一性があるため、正規分布を使用する傾向があります。線形回帰の場合、データは正常である必要はなく、残差はそうであると私は読みました。そのため、各GLMからの線形予測子の標準化されたピアソン残差と予測値を個別に出力しました(GLMの通常の同一性関数と通常の対数関数)。私は、正規性テスト(ヒストグラムとShapiro-Wilk)を実行し、予測値に対して残差をプロットしました(ランダム性と分散をチェックするため)。恒等関数の残差は正常ではありませんが、対数関数の残差は正常です。ピアソン残差は正規分布しているため、ログリンク関数で正規を選択する傾向があります。 だから私の質問は: すでにログ変換されているDVで、LOGリンク機能を備えたGLM正規分布を使用できますか? 正規分布を使用して正当化するには、分散均一性検定で十分ですか? 残差チェック手順は、リンク関数モデルの選択を正当化するために正しいですか? 左側はDV分布の画像、右側はログリンク関数を使用したGLM正規分布の残差。

2
ロジスティック関数で変換されたガウス確率変数の期待値
通常、ロジスティック関数と標準偏差はどちらも表されσσ\sigmaます。標準偏差にはσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))とsssを使用します。 私はランダムな入力を持つロジスティックニューロンを持っています。その平均μμ\muと標準偏差sssは知っています。平均との差がガウスノイズで近似できることを願っています。したがって、表記を少し乱用して、生成すると仮定しますσ(μ+N(0,s2))=σ(N(μ,s2))σ(μ+N(0,s2))=σ(N(μ,s2))\sigma(\mu + N(0,s^2))=\sigma(N(\mu,s^2))。σ (N (μ 、s 2))の期待値は何ですか?σ(N(μ,s2))σ(N(μ,s2))\sigma(N(\mu,s^2))標準偏差sssは、μμ\muまたはと比較して大きい場合と小さい場合があります111。期待値の適切な閉じた形の近似は、閉じた形の解とほぼ同じです。 閉じた形のソリューションは存在しないと思います。これは、畳み込みとみなすことができ、およびロジスティック密度のための特徴的な機能が知られている()が、私は確かにそれがどのように役立つかあまりないです。逆シンボリック計算機はで密度を認識することができませんでした0ロジスティック分布の密度の畳み込みと示唆しているが、単純な基本整数が存在しないことを証明しない標準正規分布、の。より状況証拠:ロジスティックニューロンを含むニューラルネットワークにガウス入力ノイズを追加することに関するいくつかの論文では、これらの論文は閉形式の式も提供していませんでした。πt csch πtπt csch πt\pi t ~\text{csch} ~\pi t000 この質問は、ボルツマンマシンの平均場近似の誤差を理解しようとするときに生じました。

2
変数が完全な同時依存性を示す場合、多変量中心極限定理(CLT)は成り立ちますか?
タイトルは私の質問を要約したものですが、明確にするために、次の簡単な例を検討してください。ましょう、I = 1、...、N。定義: \ begin {equation} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {equation} および \ begin {equation} T_n = \ frac {1} {n} \ sum_ ^ N(X_I ^ 2 - 1の){I 1 =} \端{式} 私の質問:にもかかわらずS_NとT_Nがときに完全に依存しており、N = 1、DO \ SQRT {N} …

1
高次モーメントのガウスライク分布
平均と分散が不明なガウス分布の場合、標準指数ファミリー形式での十分な統計はです。分布があり。Nは設計パラメーターのようなものです。この種の十分な統計ベクトルに対応する既知の分布はありますか?この分布からのサンプルが必要なので、分布から正確なサンプルを取得することが重要です。どうもありがとう。T(x)=(x,x2)T(x)=(x,x2)T(x)=(x,x^2)T(x)=(x,x2,...,x2N)T(x)=(x,x2,...,x2N)T(x)=(x,x^2,...,x^{2N})

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
逆共分散行列の仮説検定
私が観察仮定IID 、及び試験たい vechため適合行列およびベクトル。この問題に関する既知の作業はありますか?H 0:A (Σ - 1) = A A Aバツ私〜N(μ 、Σ )xi∼N(μ,Σ)x_i \sim \mathcal{N}\left(\mu,\Sigma\right)H0:A H0:A H_0: A\ (Σ− 1) =a(Σ−1)=a\left(\Sigma^{-1}\right) = aあAAaaa (私にとって)明らかな試みは、尤度比テストによるものですが、の制約のを受ける可能性を最大化するには、SDPソルバーが必要であり、かなりかもしれません。H0H0H_0

2
二分変数と連続変数の間の相関
私は二分変数と連続変数の間の相関関係を見つけようとしています。 これに関する私の最初の作業から、私は独立したt検定を使用する必要があることを発見しました。その前提条件は、変数の分布が正規でなければならないことです。 正規性をテストするためにKolmogorov-Smirnov検定を実行したところ、連続変数が非正規であり、歪んでいることがわかりました(約4,000データポイント)。 変数の範囲全体に対してコルモゴロフ・スミルノフ検定を行いました。それらをグループに分割してテストを実行する必要がありますか?つまり、私がrisk level(0=危険ではない、1=危険)とコレステロール値を持っている場合、次のことを行う必要があります: それらを次のように2つのグループに分けます。 Risk level =0 (Cholestrol level) -> Apply KS Risk level =1 (Cholestrol level) -> Apply KS それらを一緒に取り、テストを適用しますか?(データセット全体でのみ実行しました。) その後、それでも正常でない場合はどうすればよいですか? 編集: 上記のシナリオは、私が自分の問題に提供しようとした説明にすぎません。1000を超える変数と約4000のサンプルを含むデータセットがあります。それらは本質的に連続的またはカテゴリー的です。私の仕事は、これらの変数に基づいて二分変数を予測することです(たぶんロジスティック回帰モデルを考え出す)。そのため、最初の調査には、二分変数と連続変数の相関関係を見つけることが含まれると考えました。 私は変数の分布がどのようになっているかを確認しようとしていたため、t検定を試みました。ここで私は問題として正常性を見つけました。コルモゴロフ-スミルノフ検定では、これらの変数のほとんどで有意値0.00が得られました。 ここで正常性を仮定する必要がありますか?これらの変数の歪度と尖度は、ほとんどすべての場合にデータが歪んでいる(> 0)ことも示しています。 以下の注記に従って、ポイントとバイセリアルの相関をさらに調査します。しかし、変数の分布についてはまだわかりません。

3
正規(またはその他の)ディストリビューションの「ブレーク」を正式にテストする方法
社会科学では、何らかの方法で、通常は分布するはずの変数が、特定の点の周りの分布に不連続性をもたらすことがよくあります。 たとえば、「合格/不合格」などの特定のカットオフがあり、これらの対策が歪みの影響を受けている場合、その時点で不連続性がある可能性があります。 有名な例の1つ(以下に引用)は、学生の標準化されたテストのスコアが、50%から60%までの質量がほとんどなく60%から65%程度の過剰な質量がある60%を除いて、基本的にどこにでも分布します。これは、教師が自分の生徒の試験を採点する場合に発生します。著者は、教師が生徒の試験合格を本当に支援しているかどうかを調査します。 間違いなく最も説得力のある証拠は、さまざまなテストのさまざまなカットオフの周りに大きな不連続があるベルカーブのグラフを示すことです。しかし、統計的検定をどのように作成しますか?彼らは補間を試みてから、分数の上または下の分数を比較し、カットオフの上下5ポイントの分数についてもt検定を行いました。これらは賢明ですが、アドホックです。誰かがもっと良いことを考えることができますか? リンク: 生徒と学校の評価における規則と裁量:ニューヨークリージェンツ試験の事例 http://www.econ.berkeley.edu/~jmccrary/nys_regents_djmr_feb_23_2011.pdf

3
ランダム化トレース技術
M. Seegerで次のランダム化トレース手法に出会いました。「コレスキー分解の低ランク更新」、カリフォルニア大学バークレー校、Tech。担当者、2007年。 tr(A)=E[xTAx]tr⁡(A)=E[xTAx]\operatorname{tr}(\mathbf{A}) = {E[\mathbf{x}^T \mathbf{A} \mathbf{x}]} どこx∼N(0,I)x∼N(0,I)\mathbf{x} \sim N(\mathbf{0},\mathbf{I})。 数学の知識がない人として、どうやってこの平等を実現できるのか。さらに、たとえば幾何学的にをどのように解釈できxTAxxTAx\mathbf{x}^T \mathbf{A} \mathbf{x}ますか?ベクトルとその範囲の値の内積を取ることの意味を理解するためにどこを見ればよいですか?なぜ平均が固有値の合計に等しいのですか?理論的な特性に加えて、その実用的な重要性は何ですか? 機能するかどうかを確認するために、MATLABコードスニペットを作成しました #% tr(A) == E[x'Ax], x ~ N(0,I) N = 100000; n = 3; x = randn([n N]); % samples A = magic(n); % any n by n matrix A y = zeros(1, N); for i = …

3
ディラックのデルタ関数はガウス分布のサブクラスと見なされるべきですか?
ウィキデータでは、オントロジーの確率分布(他のすべてのものと同様)をリンクすることができます。たとえば、t分布は非中心t分布のサブクラスです。たとえば、次を参照してください。 https://angryloki.github.io/wikidata-graph-builder/?property=P279&item=Q209675&iterations=3&limit=3 たとえば、t分布の自由度が無限大になる場合や、正規分布(ガウス分布)の分散がゼロに近づく場合など、さまざまな制限ケースがあります。後者の場合、分布はディラックのデルタ関数に向かいます。 英語版ウィキペディアでは、現在、分散パラメーターはゼロより大きいと述べられているため、厳密な解釈をすれば、ディラックのデルタ関数が正規分布のサブクラスであるとは言えません。しかし、指数分布はディラックのデルタ関数のスーパークラスであると私が言うように、私にはそれはかなり大丈夫に思えます。 ディラックのデルタ関数がガウス分布のサブクラスであることを示すことに問題はありますか?

4
これは正しいです ?(Truncated-norm-multivariate-Gaussianの生成)
もし 、すなわち、 F X(X )= 1X∈Rn, X∼N(0–,σ2I)X∈Rn, X∼N(0_,σ2I)X\in\mathbb{R}^n,~X\sim \mathcal{N}(\underline{0},\sigma^2\mathbf{I})fX(x)=1(2πσ2)n/2exp(−||x||22σ2)fX(x)=1(2πσ2)n/2exp⁡(−||x||22σ2) f_X(x) = \frac{1}{{(2\pi\sigma^2)}^{n/2}} \exp\left(-\frac{||x||^2}{2\sigma^2}\right) 多変量の場合の切り捨て正規分布の類似バージョンが必要です。 より正確には、ノルムに制約された(値)多変量ガウスY st f Y(y )= { cを生成します。F X(Y )、 もし | | y | | ≥ 0を、 そうでありません 。 ここで、c = 1≥a≥a\geq aYYYfY(y)={c.fX(y), if ||y||≥a0, otherwise .fY(y)={c.fX(y), if ||y||≥a0, otherwise . f_Y(y) = \begin{cases} c.f_X(y), \text{ …

2
合計が正常ではない2つの*相関した*正規変数の例
私は、わずかに正常であるが共同して正常ではない相関ランダム変数のペアのいくつかの素晴らしい例を知っています。参照してください、この答えによってディリップSarwate、およびこれによって枢機卿を。 また、合計が正常でない2つの正規確率変数の例も認識しています。Macroによるこの回答を参照してください。ただし、この例では、2つの確率変数は相関していません。 非ゼロの共分散を持ち、合計が正規でない2つの正規確率変数の例はありますか?あるいは、2変量正規ではない場合でも、相関する2つの正規確率変数の合計が正常でなければならないことを証明することは可能ですか? [コンテキスト:分布を求める宿題があります。ここで、とは相関標準法線です。私はそれらが二変量正常であることを指定することを意図した質問だと思います。しかし、私は non-zero に対するこの追加の仮定なしに何かが言えるかどうか疑問に思っています。]aX+bYaX+bYaX+bYXXXYYYρρ\rhoρρ\rho ありがとう!


3
正規分布よりも裾が重いt分布
私の講義ノートには、 t分布は通常のように見えますが、裾が少し重いです。 なぜそれが正常に見えるのか理解しています(中心極限定理のため)。しかし、正規分布よりも裾が重いことを数学的に証明する方法と、正規分布よりもどの程度重いかを測定する方法があるかどうかを理解するのに苦労しています。

6
という表記はどのように読み取られますか?
という表記はどのように読み取られますか?それである以下の正規分布を?またはは正規分布ですか?または、はほぼ正常です。X∼N(μ,σ2)X∼N(μ,σ2)X\sim N(\mu,\sigma^2)XXX XXX XXX 同じ分布に従う(または単語が何であれ)いくつかの変数がある場合はどうなりますか?どのように書かれていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.