タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

3
ガンマ分布と正規分布の関係
最近、平均が0の正規確率変数の2乗のpdfを導出する必要があることがわかりました。何らかの理由で、事前に分散を正規化しないことを選択しました。これを正しく行った場合、このpdfは次のようになります。 N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} これは、実際にはガンマ分布のパラメータ化にすぎないことに気付きました。 N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2) そして、2つのガンマ(同じスケールパラメーター)の合計が別のガンマに等しいという事実から、そのガンマは 2乗正規確率変数の合計に等しいということになります。kkk N2Σ(x;k,σ2)=Gamma(x;k2,2σ2)NΣ2(x;k,σ2)=Gamma⁡(x;k2,2σ2) N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2) これは私には少し驚きでした。私が知っていたにもかかわらず乗の和の分布-分布の標準的な通常のRV車を-私は、ガンマは基本的に通常の合計を可能にだけ一般化したことに気づかなかった、ガンマの特殊なケースでした任意の分散のランダム変数。これは、指数分布が2つの正規分布の2乗の和に等しいなど、これまでに出会ったことのない他の特性化にもつながります。χ2χ2\chi^2 これはすべて私にとってやや不思議です。上記で説明したように、正規分布はガンマ分布の導出の基本ですか?私がチェックしたほとんどのリソースは、2つの分布が本質的にこのように関連していること、またはその点についてもガンマの導出方法を説明していません。これにより、複雑な方法で単純に強調した下位レベルの真実がいくつかあると思いますか?

5
最尤推定—多くの場合、バイアスがかかっているにもかかわらず使用される理由
最尤推定では、バイアスのかかった推定量が得られることがよくあります(たとえば、サンプル分散の推定値はガウス分布に対してバイアスがかけられます)。 それで何がそんなに人気があるのでしょうか?なぜそんなに正確に使用されるのですか?また、特に代替アプローチであるモーメント法よりも優れている点は何ですか? また、ガウスでは、MLE推定量を単純にスケーリングすることでバイアスが偏らないことに気付きました。なぜこのスケーリングは標準的な手順ではないのですか?つまり、なぜMLE計算の後、推定量を不偏にするために必要なスケーリングを見つけるのが日常的ではないのですか?標準的な方法は、スケーリング係数がよく知られているよく知られたガウスの場合を除いて、MLE推定値の単純な計算のようです。

3
1つの観測値の分散の信頼区間
これは、「確率論における第7回コルモゴロフ学生オリンピック」の問題です。 両方のパラメーターが不明な分布から1つの観測値与えられた場合、少なくとも99%の信頼レベルで信頼区間を与えます。XXXNormal(μ,σ2)Normal⁡(μ,σ2)\operatorname{Normal}(\mu,\sigma^2)σ2σ2\sigma^2 私には、これは不可能であると思われます。解決策はありますが、まだ読んでいません。何かご意見は? 数日中にソリューションを投稿します。 [次の編集:以下に掲載されている公式ソリューション。Cardinalのソリューションはより長くなりますが、より良い信頼区間を提供します。また、入力してくれたMaxとGlen_bにも感謝します。]

4
Shapiro–Wilkは最高の正規性テストですか?Anderson-Darlingのような他のテストよりも優れているのはなぜですか?
私は与えられた有意水準、のためので、シャピロ-ウィルク検定は、最高の正規のテストと見なされることが文献でどこかで読んだ、帰無仮説を棄却する確率は、それの偽は他の場合よりも高い場合正常性テスト。αα\alpha 可能であれば数学的な議論を使用して、他の正常性テスト(アンダーソン-ダーリングテストなど)と比較してどのように機能するかを説明してください。

1
線形回帰予測間隔
データポイントの最適な線形近似(最小二乗を使用)がラインy=mx+by=mx+by=mx+b場合、近似誤差を計算するにはどうすればよいですか?観測値と予測値の差の標準偏差を計算するei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b)と、実際の(観測されていない)値yr=real(x0)yr=real(x0)y_r=real(x_0)は区間に属します[yp−σ,yp+σ][yp−σ,yp+σ][y_p-\sigma, y_p+\sigma]()確率が約68%で、正規分布を仮定していますか?yp=mx0+byp=mx0+by_p=mx_0+b 明確にするために: 関数をいくつかの点評価することで観察しました。これらの観測値を線に適合させます。私が観察しなかったについては、大きさを知りたいと思い ます。上記の方法を使用して、prob でと言うのは正しいですか。〜68%?X I L (X )= M X + B 、X 0、F (X 0)- L (X 0)、F (X 0)∈ [ L (X 0)- σ 、L (X 0)+ σ ]f(x)f(x)f(x)xixix_il(x)=mx+bl(x)=mx+bl(x)=mx+bx0x0x_0f(x0)−l(x0)f(x0)−l(x0)f(x_0)-l(x_0)f(x0)∈[l(x0)−σ,l(x0)+σ]f(x0)∈[l(x0)−σ,l(x0)+σ]f(x_0) \in [l(x_0)-\sigma, l(x_0)+\sigma]

3
このディストリビューションには名前がありますか?
今日は私に起こったその配布 のために、ガウスとラプラス分布との間の妥協点として見ることができるX∈R、P∈[1、2]およびβ>0このような分布は、名前を持っていますか?また、正規化定数の式はありますか?私ものために解決を開始する方法がわからないので計算は、私を切り株C不可欠で 1=C⋅∫ ∞ - ∞のexp(-|X-μ | Pf(x)∝exp(−|x−μ|pβ)f(x)∝exp⁡(−|x−μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x∈R,p∈[1,2]x∈R,p∈[1,2]x\in\mathbb{R}, p\in[1,2]β>0.β>0.\beta>0.CCC1=C⋅∫∞−∞exp(−|x−μ|pβ)dx1=C⋅∫−∞∞exp⁡(−|x−μ|pβ)dx 1=C\cdot \int_{-\infty}^\infty \exp\left(-\frac{|x-\mu|^p}{\beta}\right) dx

2
イギリス英語の「正規分布」の「N」を大文字にする必要がありますか?
この質問は少し左のフィールドですが、ここのコミュニティはおそらくこのテーマについて強い見解を持っていると思いました! 私は博士論文を書いています。一貫して、正式にガウス分布に関連する数量について話すとき、それらを参照するために「正規」の「N」を大文字にしました。たとえば、「[...このような状況では]結果の分布は正規ではなく、むしろ[...]によって記述されます」。 私のスーパーバイザーは関連する章を読み、これらのすべてを小文字の「n」に置き換えました。私は、件名に任意の決定的な資料を見つけることができません-スプリンガーは明らかに望んでいた名前が正しく大文字で、とによると、インターネット上の別のランダムな男、配布名を大文字にすることは良いアイデアです。 私の論文の決定的なスタイルガイドがなかったため、私は専門家のコミュニティに頼ると思いました-一般に何が行われ、なぜですか?

1
なぜ分散のサンプリング分布はカイ二乗分布なのですか?
声明 サンプル分散のサンプリング分布は、自由度が等しいカイ二乗分布です。ここで、はサンプルサイズです(対象のランダム変数が正規分布している場合)。nn−1n−1n-1nnn ソース 私の直感 1)カイ2乗検定は2乗和のように見えるため、2)カイ2乗分布は2乗正規分布の和にすぎないため、直感的に理解できます。それでも、私はそれをよく理解していません。 質問 ステートメントは本当ですか?どうして?

3
t検定を実行するためにExcelを使用して正規分布を確認する方法は?
t検定を使用するための要件が​​満たされていることを確認するために、Excelでデータセットの正規性を確認する方法を知りたいです。 右尾については、平均と標準偏差を計算し、平均から1、2、3標準偏差を加算して範囲を作成し、使用後の標準正規分布の正規68/95 / 99.7と比較するのが適切ですか?各標準偏差値をテストするには、Excelのnorm.dist関数を使用します。 または、正常性をテストするより良い方法はありますか?

2
複数の研究からの情報を組み合わせて、正規分布データの平均と分散を推定する-ベイジアンとメタ分析のアプローチ
私は一連の論文をレビューしました。各論文は、既知のサイズそれぞれのサンプルにおける測定値の観測平均とSDを報告しています。私が設計している新しい研究で同じ測定値の可能性のある分布について可能な限り推測し、その推測にどの程度の不確実性があるかを考えたいと思います。)と仮定してうれしいです。N X 〜N (μ 、σ 2バツバツXnnnX∼N(μ 、σ2X∼N(μ、σ2X \sim N(\mu, \sigma^2 私の最初の考えはメタ分析でしたが、モデルは通常、ポイント推定と対応する信頼区間に焦点を当てています。ただし、の完全な分布について何か言いたいことがあります。この場合、分散について推測することも含まれます。 σ 2バツバツXσ2σ2\sigma^2 私は、事前の知識に照らして、特定の分布のパラメーターの完全なセットを推定するための可能なBayeisanアプローチについて読んでいます。これは一般的に私には理にかなっていますが、ベイジアン分析の経験はゼロです。これは、歯を切るのが簡単で比較的単純な問題のようにも思えます。 1)私の問題を考えると、どのアプローチが最も理にかなっており、なぜですか?メタ分析またはベイジアンアプローチ? 2)ベイジアンアプローチが最適だと思う場合、これを実装する方法を教えていただけますか(できればRで)。 関連する質問 編集: 私は、これを「単純な」ベイジアン様式だと思う方法で解決しようとしています。 上で述べたように、私は推定された平均でなく、事前情報、すなわちを考慮した分散にも興味があります。μμ\muσ2σ2\sigma^2P(μ 、σ2| Y)P(μ、σ2|Y)P(\mu, \sigma^2|Y) 繰り返しになりますが、実際のベイジアンについては何も知りませんが、平均と分散が未知の正規分布の事後分布は、正規逆ガンマ分布の共役を介した閉形式解を持っていることを見つけるのに時間がかかりませんでした。 問題はとして再定式化されます。P(μ 、σ2| Y)= P(μ | σ2、Y)P(σ2| Y)P(μ、σ2|Y)=P(μ|σ2、Y)P(σ2|Y)P(\mu, \sigma^2|Y) = P(\mu|\sigma^2, Y)P(\sigma^2|Y) P(μ | σ2、Y)P(μ|σ2、Y)P(\mu|\sigma^2, Y)は正規分布で推定されます。逆ガンマ分布のP(σ2| Y)P(σ2|Y)P(\sigma^2|Y)。 それはそれのまわりで私の頭を取得するために私にしばらく時間がかかったが、これらのリンクから(1、2、私はR.でこれを行う方法をソートするために、私が思うに、できました) 33個のスタディ/サンプルそれぞれの行と、平均、分散、サンプルサイズの列から構成されるデータフレームから始めました。事前情報として、1行目の最初の調査の平均、分散、サンプルサイズを使用しました。次に、次の調査の情報でこれを更新し、関連するパラメーターを計算し、正規逆ガンマからサンプリングしておよび分布を取得しました。これは、33の研究すべてが含まれるまで繰り返されます。μμ\muσ2σ2\sigma^2 # Loop start values values i <- 2 …

3
非正定共分散行列はデータについて何を教えてくれますか?
多くの多変量観測値があり、すべての変数の確率密度を評価したいと思います。データは正規分布していると想定されます。変数の数が少ない場合、すべてが期待どおりに機能しますが、より大きな数に移動すると、共分散行列が非正定値になります。 Matlabの問題を次のように減らしました: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. err> 0の場合、シグマは正定ではありません。 より高い次元で実験データを評価するためにできることはありますか?それは私のデータについて有用なことを教えてくれますか? 私はこの分野の初心者ですが、明らかな何かを見逃してしまった場合はおologiesびします。

2
極値理論-ショー:ガンベルに垂直
の最大値 iid Standardnormalsは、極値理論に従って標準ガンベル分布に収束します。バツ1、… 、Xn。〜X1,…,Xn.∼X_1,\dots,X_n. \sim どのようにそれを示すことができますか? 我々は持っています P(最大X私≤ X )= P(X1≤ X 、... 、Xn≤ X )= P(X1≤ X )⋯ P(Xn≤ X)= F(x )nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n 我々は、選択/検索する必要が定数のシーケンスように:F \左(A_N X + B_N \右)^ …

1
ウェーブレット領域のガウス過程:共分散とは?
私は、Maraunら、「ウェーブレット領域の非定常ガウス過程:合成、推定、および重要なテスト」(2007)を読みました。これは、ウェーブレット領域の乗数によって指定できる非定常GPのクラスを定義します。そのようなGPの実現は次 ここではホワイトノイズ、はウェーブレットに関する連続ウェーブレット変換です。、はスケールと時間の乗数(フーリエ係数のようなもの)であり、は再構成ウェーブレット逆ウェーブレット変換です。η (t )W g g m (b 、a )a b M h hs (t )= Mhm (b 、a )Wgη(t )、s(t)=Mhm(b,a)Wgη(t), s(t) = M_h m(b,a) W_g \eta(t)\, , η(t )η(t)\eta(t)WgWgW_ggggm (b 、a )m(b,a)m(b,a)aaabbbMhMhM_hhhh この論文の重要な結果の1つは、乗数変化がゆっくりである場合、実現自体はと実際の選択に「わずかに」依存するということです。したがって、はプロセスを指定します。彼らは、実現に基づいてウェーブレット乗数を推測するのに役立ついくつかの重要なテストを作成し続けます。g h m (b 、a )m (b 、a )m(b,a)m(b,a)ggghhhm (b 、a )m(b,a)m(b,a) 2つの質問: 1.ある標準GP尤度をどのように評価しますか?p (D )= N(0 …

3
2つの正規分布の差の分布
正規分布の2つの確率密度関数があります。 f1(x1|μ1,σ1)=1σ12π−−√e−(x−μ1)22σ21f1(x1|μ1,σ1)=1σ12πe−(x−μ1)22σ12f_1(x_1 \; | \; \mu_1, \sigma_1) = \frac{1}{\sigma_1\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_1)^2}{2\sigma_1^2} } そして f2(x2|μ2,σ2)=1σ22π−−√e−(x−μ2)22σ22f2(x2|μ2,σ2)=1σ22πe−(x−μ2)22σ22f_2(x_2 \; | \; \mu_2, \sigma_2) = \frac{1}{\sigma_2\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_2)^2}{2\sigma_2^2} } 私はx1x1x_1と間の分離の確率密度関数を探していx2x2x_2ます。私はそれが確率密度関数を探していることを意味すると思います x 1 − x 2 | |x1−x2||x1−x2||x_1 - x_2|。あれは正しいですか?どうやって見つけるの?

5
なぜ正規分布の
初めて正規分布モンテカルロシミュレーションを行ったときにショックを受けたのは、サンプルサイズがのみであるサンプルからの標準偏差の平均がはるかに小さいことが判明したことです。つまり、回の平均よりも、母集団の生成に使用される\ sigmaです。ただし、これはあまり覚えていない場合はよく知られていますが、私はそれを知っていました。これがシミュレーションです。100100100100100100n=2n=2n=22π−−√2π \sqrt{\frac{2}{\pi }}σσ\sigma 100、n = 2、\ text {SD}の推定値、および\ text {E}(s_ {n = 2})= \ sqrt \を使用してN(0,1)の 95%信頼区間を予測する例を次に示します。 frac {\ pi} {2} \ text {SD}。N(0,1)N(0,1)N(0,1)n=2n=2n=2SDSD\text{SD}E(sn=2)=π2−−√SDE(sn=2)=π2SD\text{E}(s_{n=2})=\sqrt\frac{\pi}{2}\text{SD} RAND() RAND() Calc Calc N(0,1) N(0,1) SD E(s) -1.1171 -0.0627 0.7455 0.9344 1.7278 -0.8016 1.7886 2.2417 1.3705 -1.3710 1.9385 2.4295 1.5648 -0.7156 1.6125 2.0209 1.2379 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.