タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

2
なぜ二乗差がそれほど一般的に使用されるのですか?
新しい統計手法と概念を調査するとき、非常に多くの場合、差の2乗(または2乗平均誤差、または他の多数の誤字)に遭遇します。ちょうど例として、ピアソンのrは、ポイントが存在する回帰直線からの平均二乗差に基づいて決定されます。ANOVAの場合は、二乗和などを見ています。 今、私はすべてを二乗することで、外れ値のあるデータが実際にペナルティを受けることを確認しています。しかし、なぜ指数が正確に2で使用されているのですか?2.1、e、pi、その他何でもないのはなぜですか?2が使用される特別な理由はありますか、それとも単なる慣習ですか?私は説明が釣鐘曲線と関係があるかもしれないと思うが、私はかなり確信している。

2
CNNザビエル重みの初期化
一部のチュートリアルで、「Xavier」の重みの初期化(論文:ディープフィードフォワードニューラルネットワークのトレーニングの難しさを理解する)がニューラルネットワークの重みを初期化する効率的な方法であると述べたことがわかりました。 完全に接続されたレイヤーの場合、これらのチュートリアルには経験則がありました。 Var(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad Var(W) = \frac{1}{n_{in}} ここで、は、正規分布で初期化されたレイヤーの重みの分散で、、は、親と現在のレイヤーのニューロンの量です。Var(W)Var(W)Var(W)ninninn_{in}noutnoutn_{out} 畳み込み層にも同様の経験則がありますか? 畳み込み層の重みを初期化するのに最適な方法を見つけるのに苦労しています。たとえば、重みの形状がであり(5, 5, 3, 8)、カーネルサイズがであるレイヤーでは5x5、3つの入力チャネル(RGB入力)をフィルタリングし、8特徴マップを作成します... 3入力ニューロンの量と見なされますか?またはむしろ75 = 5*5*3、入力は5x5各カラーチャネルのパッチなので、 問題を明確にする具体的な回答か、重みの適切な初期化を見つけ、できればソースをリンクする一般的なプロセスを説明する、より一般的な回答の両方を受け入れます。

1
個々のサンプルの確率が0であるのに、なぜMLEが理にかなっていますか?
これは、いくつかの古い統計を確認しているときに感じた奇妙な考えであり、何らかの理由でその答えを考えることができないようです。 連続PDFは、特定の範囲の観測値の密度を示します。すなわち、場合X∼N(μ,σ2)X∼N(μ,σ2)X \sim N(\mu,\sigma^2)、例えば、次に実現が間に入る確率とBは単に∫ bは φを(X )D Xここでφは、標準正規の密度です。aaabbb∫baϕ(x)dx∫abϕ(x)dx\int_a^{b}\phi(x)dxϕϕ\phi たとえばμμ\muパラメーターのMLE推定を行うことを考えるとき、たとえばNNNランダム変数X1..XNX1..XNX_1 .. X_Nの結合密度を書きます。。X Nとする対数尤度WRT分化μμ\mu、0に等しく設定し、について解きますμμ\mu。しばしば与えられる解釈は「データが与えられると、どのパラメーターがこの密度関数をもっともらしいものにするか」です。 私を悩ませている部分はこれです:NNN rvの密度があり、特定の実現、たとえばサンプルを取得する確率は正確に0です。データ(繰り返しますが、実際のサンプルを観察する確率は正確に0です)? 私が思いつく唯一の合理化は、領域内の積分(したがって、この領域内のデータを観測する確率)が最高になるように、観測されたサンプルの周囲で PDFを可能な限りピークにしたいということです。

3
テストスコアは本当に正規分布に従っていますか?
GLMでどのディストリビューションを使用するかを学習しようとしており、通常のディストリビューションを使用するタイミングについて少し混乱しています。私の教科書の一部では、正規分布は試験の得点をモデル化するのに適していると言っています。次のパートでは、自動車保険の請求をモデル化するのにどのような配分が適切かを尋ねます。今回は、正の値のみで連続しているため、適切な分布はガンマまたは逆ガウスになると述べました。まあ、試験の得点も正の値のみで連続するので、なぜそこに正規分布を使用するのでしょうか?正規分布は負の値を許可しませんか?

5
範囲が0〜1で、それらの間にピークがある分布ですか?
ディストリビューションはありますか、または下の画像のようなディストリビューションを作成するために別のディストリビューションから作業できますか(悪い描画の謝罪)? ここで、ピークが存在する場所の数値(例では0.2、0.5、0.9)と、関数をより広くまたはより小さくする標準偏差(シグマ)を指定します。 PS:与えられた数が0.5の場合、分布は正規分布です。

1
スティーブスーの中国における天才の計算
物理学者のSteve Hsuは、彼のブログで次のように書いています。 正規分布を仮定すると、+ 4SDでパフォーマンスをする米国の人口は約1万人にすぎず、ヨーロッパでも同様の人数です。これは非常に限られた人口です(米国では毎年上位数百人の高校生)。 NEアジア人の数を中国の13億人の人口に外挿すると、このレベルで30万人のような人が得られますが、これはかなり圧倒的です。 以下のような唯一の共通の算術演算子を使用して、非統計に-あなたは平易な英語でスティーブの文は説明でき、および?+++−−-

3
線形回帰:OLSとMLEの同一性を与える非正規分布はありますか?
この質問は、ここでのコメントの長い議論から着想を得ています: 線形回帰は正規分布をどのように使用しますか? :通常の線形回帰モデルでは、単純化のためにここで一つだけの予測で書かれた 知られている定数であり、ゼロ平均の独立した誤差項です。さらに誤差の正規分布を仮定すると、の通常の最小二乗推定量と最尤推定量は同じです。Yi=β0+β1xi+ϵiYi=β0+β1xi+ϵ私 Y_i = \beta_0 + \beta_1 x_i + \epsilon_i xixix_iϵiϵi\epsilon_iβ0,β1β0,β1\beta_0, \beta_1 だから私の簡単な質問:mleが通常の最小スクアレス推定量と同一になるような誤差項の他の分布はありますか?1つの含意は簡単に表示でき、もう1つの含意はそうではありません。


2
2つの通常の製品の合計はラプラスですか?
これは、明らかにケースで、もし、その後、Xi∼N(0,1)Xi∼N(0,1)X_i \sim N(0,1) X1X2+X3X4∼Laplace(0,1)X1X2+X3X4∼Laplace(0,1)X_1 X_2 + X_3 X_4 \sim \mathrm{Laplace(0,1)} 任意の二次形式に関する論文を見てきましたが、それは常に恐ろしい非中心カイ二乗式をもたらします。 上記の単純な関係は、私にはまったく明白ではないように思えるので、(もしそうなら!)上記の単純な証拠は誰にもありますか?

3
データが正規分布と対数正規分布のサンプルである相対尤度を計算するアルゴリズムが必要
値のセットがあり、ガウス(正規)分布からサンプリングされたか、対数正規分布からサンプリングされた可能性が高いかどうかを知りたいとしましょう。 もちろん、理想的には、母集団または実験誤差の原因について何かを知っているので、質問に答えるのに役立つ追加情報があります。しかし、ここでは、数字のセットのみがあり、他の情報はないと仮定します。ガウス分布からのサンプリングと対数正規分布からのサンプリングのどちらがより可能性が高いでしょうか?どれくらい可能性がありますか?私が望んでいるのは、2つのモデルから選択するアルゴリズムで、できればそれぞれの相対的な可能性を定量化することです。

3
なぜガウス分布と見なされることが多いのですか?
上のウィキペディアの記事から引用 単純ベイズ分類器のパラメータ推定:「典型的な仮定は、各クラスに関連付けられた連続値がガウス分布に従って分布していることです。」 分析上の理由から、ガウス分布が便利であることを理解しています。しかし、この仮定をする他の現実的な理由はありますか?人口が2つのサブ集団(スマート/ダムの人々、大きなリンゴ/小さなリンゴ)で構成されている場合はどうなりますか?

2
なぜガウスの「識別」分析モデルがそう呼ばれているのですか?
ガウス判別分析モデルはを学習し、次にベイズ規則を適用して したがって、それらは生成モデルです。なぜそれが判別分析と呼ばれるのですか?クラス間の判別曲線を最終的に導出するためである場合、それはすべての生成モデルで発生します。P(x | y)P(バツ|y)P(x|y)P(y| x)= P(x | y)Pp R I O R(y)Σg∈ YP(x | g)PP Rのi個のOR(g)。P(y|バツ)=P(バツ|y)Ppr私or(y)Σg∈YP(バツ|g)Ppr私or(g)。P(y|x) = \frac{P(x|y)P_{prior}(y)}{\Sigma_{g \in Y} P(x|g) P_{prior}(g) }.

1
ノイズの多い観測から真の平均を決定する
フォーム(平均、標準偏差)のデータポイントの大規模なセットがあります。これを単一の(より良い)平均に、そして(できれば)より小さな標準偏差に減らしたいと思います。 明らかに、単に計算できましたが、データポイントのいくつかが他のものよりもはるかに正確であるという事実を考慮に入れていません。∑ dトンのAM E NN∑datameanN\frac{\sum data_{mean}}{N} 簡単に言えば、これらのデータポイントの加重平均を作成したいのですが、標準偏差に関して加重関数がどうあるべきかはわかりません。

3
無限分散の正規分布の値がその平均よりも大きい確率はどのくらいですか?
今日のインタビューでこれに似たものを尋ねられました。 インタビュアーは、ボラティリティが無限になりやすい場合に、アットザマネーオプションがインザマネーになる可能性を知りたいと考えました。 ブラックショールズモデルとランダムウォーク仮説の基礎となる正規分布には無限の分散があるため、0%と言いました。そして、すべての値の確率はゼロになると考えました。 私のインタビュアーは、正規分布はまだ対称でほぼ均一なので、正しい答えは50%であると言いました。したがって、平均値から+∞まで積分すると、50%になります。 私はまだ彼の推論に納得していない。 誰が正しい?

11
標準偏差は完全に間違っていますか?どのように高さ、カウントなどの正の数値を計算できますか?
高さ(cm)を計算していて、数値はゼロよりも大きくなければならないとします。 サンプルリストを次に示します。 0.77132064 0.02075195 0.63364823 0.74880388 0.49850701 0.22479665 0.19806286 0.76053071 0.16911084 0.08833981 Mean: 0.41138725956196015 Std: 0.2860541519582141 この例では、正規分布に従って、値の99.7%が平均からの標準偏差の±3倍の間にある必要があります。ただし、標準偏差の2倍でも負になります。 -2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468 しかし、私の数字は正でなければなりません。負の数は無視できますが、これが標準偏差を使用して確率を計算する正しい方法だとは思いません。 これを正しい方法で使用しているかどうかを誰かが理解するのを助けることができますか?または、別の方法を選択する必要がありますか? 正直言って、数学は数学です。正規分布であるかどうかは関係ありません。符号なしの数値で動作する場合、正の数値でも動作するはずです!私が間違っている? EDIT1:ヒストグラムを追加しました より明確にするために、実際のデータのヒストグラムを追加しました EDIT2:いくつかの値 Mean: 0.007041500928135767 Percentile 50: 0.0052000000000000934 Percentile 90: 0.015500000000000047 Std: 0.0063790857035425025 Var: 4.06873389299246e-05

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.