タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

1
通常の可能性と通常の事前確率で正方形を完了するにはどうすればよいですか?
中断したところから正方形を完成させるにはどうすればよいですか?これまでのところ正しいですか? 私はの形式の通常の事前を持っています。P (β | σ 2)〜N(0 、σ 2 V )ββ\betap(β|σ2)∼N(0,σ2V)p(β|σ2)∼N(0,σ2V)p(\beta|\sigma^2)\sim \mathcal{N}(0,\sigma^2V) p (β| σ2)= (2 πσ2V)p2exp[ − 12つのσ2βTβ]p(β|σ2)=(2πσ2V)p2exp⁡[−12σ2βTβ]p(\beta|\sigma^2)=(2\pi\sigma^2V)^\frac{p}{2}\exp[-\frac{1}{2\sigma^2}\beta^T\beta] ここで、は です。P Σ iは= 1 β 2 IβTββTβ\beta^T\betaΣi = 1pβ2私∑i=1pβi2\sum\limits_{i=1}^p \beta_i^2 私の可能性は、の形式のデータポイントyの正規分布を持っていますp (y| β、σ2)〜N(B β、σ2私)p(y|β,σ2)∼N(Bβ,σ2I)p(y|\beta,\sigma^2)\sim\mathcal{N}(B\beta,\sigma^2I) p (y| β、σ2)= (2 πσ2V)ん2exp[ − 12つのσ2(Y - B β)T(Y - B β)]p(y|β,σ2)=(2πσ2V)n2exp⁡[−12σ2(y−Bβ)T(y−Bβ)]p(y|\beta,\sigma^2)=(2\pi \sigma^2V)^\frac{n}{2}\exp[-\frac{1}{2\sigma^2}({\bf y}-{\bf B}{\bf \beta})^T({\bf …


2
2変量正規分布のJensen-Shannon発散
2つの二変量正規分布とられた場合、それらの間のJensen-Shannon発散を計算しようとしています、として次のように定義されます( ここでKLDはカルバックライブラーダイバージェンスです) 、およびM = \ frac {1} {2}(P + Q)分布のパラメーター、したがってJSDに関してKLD を計算する方法を見つけました。 J S D (P ‖ Q )= 1P≡N(μp,Σp)P≡N(μp,Σp)P \equiv \mathcal{N}(\mu_p, \Sigma_p)Q≡N(μq,Σq)Q≡N(μq,Σq)Q \equiv \mathcal{N}(\mu_q, \Sigma_q)JSD(P∥Q)=12(KLD(P∥M)+KLD(Q∥M))JSD(P‖Q)=12(KLD(P‖M)+KLD(Q‖M))JSD(P\|Q) = \frac{1}{2} (KLD(P\|M)+ KLD(Q\|M))KLDKLDKLDM=12(P+Q)M=12(P+Q)M=\frac{1}{2}(P+Q)KLDKLDKLDJSDJSDJSD 私の疑問は: Mを計算するにMMMは、M≡N(12(μp+μq),12(Σp+Σq))M≡N(12(μp+μq),12(Σp+Σq))M \equiv \mathcal{N}(\frac{1}{2}(\mu_p + \mu_q), \frac{1}{2}(\Sigma_p + \Sigma_q))。これは正しいですか? [ 1 ]でJSDJSDJSDが制限されていることを読みましたが、正規分布について上記で説明したように計算すると、そのようには見えません。それは私がそれを間違って計算している、仮定に違反している、または私が理解できない何かを意味しているのですか?

3
異なる共分散の2つの2変量分布間のマハラノビス距離
質問はタイトルにかなり含まれています。異なる共分散行列の2つの分布のマハラノビス距離はどれくらいですか?これまでに見つけたものは、両方の分布に対して同じ共分散、つまり次のようなものを想定しています。 ΔTΣ−1ΔΔTΣ−1Δ\Delta^T \Sigma^{-1} \Delta 2つの異なるがある場合はどうなりΣΣ\Sigmaますか? 注:-問題はこれです。同じ次元であるが、互いに回転および平行移動する2変量分布が2つあります(申し訳ありませんが、統計的なものではなく、純粋な数学的背景に由来します)。それらの重なり具合/距離を測定する必要があります。 * 更新:* 2つの分布の平均値の間の距離が必要だということを、私が尋ねていることで暗黙的であるかどうかはわかりません。平均がどこにあるかはわかっていますが、2つの分布は互いに対して回転しているため、異なる方向に異なる重みを割り当てる必要があるため、平均間の単純なユークリッド距離では機能しません。さて、私が理解しているように、分布が異なる形の場合、マハラノビス距離を使用してこの情報を測定することはできません(明らかに、同一の共分散の2つの多変量正規分布で機能しますが、一般的なケースでは機能しません)。異なる重みで向きをエンコードするというこの願いをエンコードする良い方法はありますか?



2
多くの人が、歪んだデータを機械学習アプリケーション用の通常の分散データに変換したいのはなぜですか?
画像および表形式のデータの場合、多くの人が、前処理中に歪んだデータを正規分布データに変換します。 機械学習における正規分布とはどういう意味ですか?それは機械学習アルゴリズムの本質的な仮定ですか? 画像データでさえ、画像のピクセル全体を正規分布または均一分布に従うように変換する分位変換を見てきました。 私は1つの理由を考えることができます:外れ値の影響を回避するため。しかし、これらの変換はデータの元の分布を歪めます。 なぜ正規分布が機械学習にとって非常に重要で、多くの前処理にこのステップが含まれているのですか?

1
IID正規確率変数のセットの中央値の平均と分散は何ですか?
レッツ、...、同一の独立を持つ確率変数配布さX1X1X_1XnXnX_nN(μ 、σ2)N(μ,σ2)N(\mu, \sigma^2) サンプル平均が。バツ¯=1んΣんi = 0バツ私X¯=1n∑i=0nXi\bar{X} = \frac{1}{n}\sum^n_{i = 0}{X_i}N(μ 、σ2ん)N(μ,σ2n)N(\mu, \frac{\sigma^2}{n}) ただし、サンプルの中央の分布が何であるか、特にその平均値と分散値を見つけるのに苦労しています。m個の電子のDi a n (X)median(X)median(X) 2つの条件間で実行する必要があるテストの数を減らすために、定義済みのグループにいくつかの機能をまとめようとしているので、質問します。 これに対する単純な答えがない場合、私が疑っているように、私は分散、特にとの違いを知ることに興味があります。m個の電子のDi a n (X)median(X)median(X)バツ¯X¯\bar{X}

2
カイ二乗分布の制限が正規分布であるのはなぜですか?
私の教授はそれを主張しました limp→∞χ2plimp→∞χp2\lim_{p\to\infty}\chi^2_p正規分布があります。主張は中心極限定理に基づいて行われました:として、法線ます。この主張は、の限界だろうと私は、これが有効でも真であるかを確認していない左側のを、まだまた、右側に表示されます。さらに、とどちらも依存します...p→∞p→∞p\to\infty(pμ,p2σ2)(pμ,p2σ2)(p\mu, p^2\sigma^2)ppppppσ2σ2\sigma^2μμ\muppp 何が欠けているのか、この制限の分布をどのようにして納得させるのですか?

1
打ち切られた法線の期待値の計算
ミル比の結果を使用して、とすると、X∼N(μ,σ2)X∼N(μ,σ2)X \sim N(\mu, \sigma^2) E(X|X&lt;α)=μ−σϕ(a−μσ)Φ(a−μσ)E(X|X&lt;α)=μ−σϕ(a−μσ)Φ(a−μσ)E(X| X<\alpha) = \mu - \sigma\frac{\phi(\frac{a- \mu}{\sigma})}{\Phi(\frac{a-\mu}{\sigma})} ただし、Rで計算すると、正しい結果が得られません。 &gt; mu &lt;- 1 &gt; sigma &lt;- 2 &gt; a &lt;- 3 &gt; x &lt;- rnorm(1000000, mu, sigma) &gt; x &lt;- x[x &lt; a] &gt; mean(x) [1] 0.4254786 &gt; &gt; mu - sigma * dnorm(a, mu, sigma) / …

1
正規確率変数の合計
n個の独立した通常のrvのサンプルを考えます。それらのサブセットの合計が残りのrvの合計よりも大きくなる確率を計算する体系的な方法を特定したいと思います。例:魚の個体数。平均:10 kg、標準偏差:3 kg。私は5匹の魚(n = 5)を釣ります。2匹の魚が他の3匹の魚よりも重くなる確率はどのくらいですか?従うことができるステップは、魚のすべての組み合わせの確率を計算してから、それらの和集合に包含除外式を使用することです。もっと賢いものはありますか?注:4匹の魚を考慮した場合、2匹が他の2匹よりも重い確率は1になります。これはどのようにすぐに計算できますか?答えてくれてありがとう。

2
無相関+共同正規性=独立。どうして?直感と力学
とは無相関であるが独立していないという事実によって単純に例示されているように、無相関である2つの変数は必ずしも独立しているとは限りません。ただし、相関関係がなく、共に正規分布している2つの変数は、独立していることが保証されています。これが真実である理由を誰かが直感的に説明できますか?2つの変数の結合正規性は、2つの変数間のゼロ相関の知識に正確に何を追加しますか?これにより、これらの2つの変数は独立している必要があると結論付けることができますか?バツXXバツ2X2X^2

1
このパラメーター推定戦略は何と呼ばれますか?
レッツ平均して正規分布からのランダムサンプルであってもと分散。を推定する問題を考えます。X1,X2,…,XnX1,X2,…,XnX_1, X_2, \ldots, X_nμμ\muσ2σ2\sigma^2P(X&gt;100)P(X&gt;100)P(X > 100) これを実行する1つの方法は、を計算することです。この「プラグイン」推定器は一貫しており、そのバイアスとMSEは簡単に計算できます。n−1∑ni=11(Xi&gt;100)n−1∑i=1n1(Xi&gt;100)n^{-1}\sum_{i=1}^n \mathbb{1}(X_i > 100) 私の生徒の小さなグループが問題に取り組む別の方法を考え出しました:計算 これは、という事実によって動機付けられ この推定量も一貫していますが、そのバイアスとMSEの計算はより困難です。1−Φ(100−x¯s).1−Φ(100−x¯s). 1 - \Phi\left(\frac{100 - \bar{x}}{s} \right). P(X&gt;100)=1−Φ[(100−μ)/σ].P(X&gt;100)=1−Φ[(100−μ)/σ].P(X > 100) = 1 - \Phi[(100 - \mu)/\sigma]. 私の質問はこれです。この種の戦略には名前がありますか?まだプラグインしているのでお願いしますが、これはいわゆるプラグインエスティメータではありません。

1
事前に指定された合計で、同一に分布する従属正規乱数を生成します
生成する方法 んnn それらの合計が事前に指定された間隔内に収まるように、同一に分布しているが独立していない通常の乱数 [ a 、b ][a,b][a,b] 確率で ppp? (この質問は、事前に指定されたポイントで終わるランダムウォークを生成することによって動機付けられます。結局、ランダムプロセスはそれほどランダムではありません(決定論的)。最終的に間隔全体を要求します。) 編集:特異ガウス分布からのサンプルの生成は、重複として提案されています。これは、正定共分散行列を使用して正規分布乱数を生成するの重複として閉じられます。これらの両方が役立つことに同意します。ただし、現在の質問(より具体的には、回答)のポイントは、まず多変量正規分布を使用して質問に対処できることを理解し、次に、どのような共分散行列が機能するかを理解することです。その共分散のある分布からサンプリングする方法は、リンクされたスレッドが役立つ3番目のステップです。

1
テストするかどうかの背後にある理論
仮定 Xi∼i.i.d.N(μ,σ2)Xi∼i.i.d.N(μ,σ2)X_i \stackrel{\mbox{i.i.d.}}{\sim} \mathcal{N} (\mu, \sigma^2)、 どこ σ2σ2\sigma^2知られている。このデータを使用して、μ∈Qμ∈Q\mu \in \mathbb{Q}、つまり、平均かどうか μμ\mu 有理数です。 ノイズが多すぎるため、これを実行できないことは直感的に明らかです。どのようなテストでもタイプIIのエラー率になると思いますβ=0β=0\beta = 0 タイプIのエラー率 α=1α=1\alpha = 1またはその逆。しかし、私はこの仮説検定問題について理論的な説明をする方法を理解していません。この問題は、テストが「難しい」場合を示すより一般的なフレームワークにどのように当てはまりますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.