タグ付けされた質問 「normal-distribution」

正規分布、つまりガウス分布には、対称的な鐘型の曲線である密度関数があります。これは、統計で最も重要な分布の1つです。[normality]タグを使用して、正常性のテストについて尋ねます。

3
ポアソン分布の正規近似
ここウィキペディアでそれは言う: 値が十分大きい場合(たとえば)、平均と分散(標準偏差)の正規分布は、ポアソン分布の優れた近似です。場合約10より大きい場合、その後、正規分布は、適切な連続性補正が行われた場合、すなわち、良好な近似である(小文字)ここで、負でない整数であることにより、置換されていますλλλλ>1000λ>1000λ>1000λλλλλλλ−−√λ\sqrt{\lambda}λλλP(X≤x),P(X≤x),P(X ≤ x),xxxP(X≤x+0.5).P(X≤x+0.5).P(X ≤ x + 0.5). FPoisson(x;λ)≈Fnormal(x;μ=λ,σ2=λ)FPoisson(x;λ)≈Fnormal(x;μ=λ,σ2=λ)F_\mathrm{Poisson}(x;\lambda) \approx F_\mathrm{normal}(x;\mu=\lambda,\sigma^2=\lambda) 残念ながら、これは引用されていません。私はこれをいくつかの厳密さで示し/証明できるようにしたいです。\ lambda> 1000の場合、正規分布が良い近似であると実際に言うにはどうすればよいですか。この「優れた」近似をどのように定量化し、どの測度を使用しましたか?λ>1000λ>1000\lambda > 1000 私がこれで得た最も遠いところは、ここでジョンがベリーエッセンの定理の使用について話し、2つのCDFのエラーを概算します。私が見ることができることから、彼はλ≥1000λ≥1000\lambda \geq 1000値を試していません。

3
空間プロセスのパラメーターの推定
正の整数値のグリッドが与えられます。これらの数値は、そのグリッド位置を占める人の信念の強さに対応する強度を表します(値が高いほど、信念が高いことを示します)。人は一般に、複数のグリッドセルに影響を与えます。n × nn×nn\times n 強度のパターンは「ガウスに見える」はずで、高強度の中心位置があり、強度はすべての方向に放射状に次第に細くなると思います。具体的には、分散のパラメーターとスケールファクターのパラメーターを持つ「スケーリングされたガウス」からの値としてモデル化したいと思います。 2つの複雑な要因があります。 バックグラウンドノイズやその他の影響により、人がいない場合はゼロの値に対応しませんが、値は小さくする必要があります。ただし、これらは不安定になる可能性があり、最初の近似では、単純なガウスノイズとしてモデル化することが困難な場合があります。 強度の範囲は異なる場合があります。1つの例では、値の範囲は1〜10で、別の例では1〜100です。 適切なパラメータ推定戦略、または関連文献へのポインタを探しています。なぜ私がこの問題にまったく間違った方法で取り組んでいるのかについてのポインタも評価されます:)。私はクリギングとガウス過程について読んでいますが、それは私の問題にとって非常に重い機械のようです。

3
平均と分散が不明な正規分布のJeffreys Prior
私は以前の分布を調べており、平均と未知の分散が不明な正規分布確率変数のサンプルについて、ジェフリーズを事前に計算しました。私の計算によると、以前のジェフリーズは次のようになっています: ここで、はフィッシャーの情報行列です。p(μ,σ2)=det(I)−−−−−√=det(1/σ2001/(2σ4))−−−−−−−−−−−−−−−−−−√=12σ6−−−−√∝1σ3.p(μ,σ2)=det(I)=det(1/σ2001/(2σ4))=12σ6∝1σ3. p(\mu,\sigma^2)=\sqrt{det(I)}=\sqrt{det\begin{pmatrix}1/\sigma^2 & 0 \\ 0 & 1/(2\sigma^4)\end{pmatrix}}=\sqrt{\frac{1}{2\sigma^6}}\propto\frac{1}{\sigma^3}.III しかし、私は出版物や、 p(μ,σ2)∝1/σ2p(μ,σ2)∝1/σ2p(\mu,\sigma^2)\propto 1/\sigma^2 Kass and Wassermann(1996)のセクション2.2を参照してください。 p(μ,σ2)∝1/σ4p(μ,σ2)∝1/σ4p(\mu,\sigma^2)\propto 1/\sigma^4 Yang and Berger(1998)の 25ページを参照 未知の平均と分散を持つ正規分布の場合のJeffreys事前として。以前の「実際の」ジェフリーズとは何ですか?

2
異分散性と残差の正規性
私は非常に良い線形回帰を持っていると思います(大学のプロジェクトのため、本当に正確である必要はありません)。 ポイントは、私が残差対予測値をプロットした場合、(私の教師によれば)不均一分散のヒントがあることです。 しかし、残差のQQプロットをプロットすると、それらが正規分布していることは明らかです。さらに、残差のシャピロ検定の値はなので、残差が実際に正規分布していることは間違いないと思います。ppp0.80.80.8 質問:残差が正規分布している場合、予測値に不均一性はどのようにありますか?


1
正規性違反の程度の良い指標とは何ですか?また、その指標にどんな説明ラベルを付けることができますか?
環境: 以前の質問で、@ Robbieは約600のケースを対象とした調査で、正規性の検定が有意な非正規性を示唆しているにもかかわらず、プロットが正規分布を示唆している理由を尋ねました。何人かの人々は、正規性の有意性検定はあまり有用ではないと主張しました。小さなサンプルの場合、このようなテストは正常性の軽度の違反を検出する能力があまりなく、大きなサンプルの場合、問題にならないほど十分に小さい正常性の違反を検出します。 この問題は、有意性検定と効果サイズに関する議論に似ているように思えます。有意性検定のみに焦点を当てると、大きなサンプルがある場合、実際的な目的には関係のない小さな影響を検出でき、小さなサンプルでは十分なパワーがありません。 いくつかの例では、小さな影響は統計的に有意であるため、サンプルが「大きすぎる」可能性があることを人々に助言するテキストを見たこともあります。 有意性検定と効果サイズのコンテキストでは、1つの簡単な解決策は、効果があるかどうかのバイナリー決定ルールに取り付かれるのではなく、関心のある効果のサイズの推定に焦点を当てることです。効果サイズの信頼区間はそのようなアプローチの1つですが、ベイジアンアプローチの何らかの形を採用することもできます。さらに、さまざまな研究領域は、「小さい」、「中」、「大きい効果」などのヒューリスティックラベルを適用して、特定の効果サイズが実際的な意味で何を意味するかについてのアイデアを構築します。これは、対象となる特定のパラメーターを推定する際の精度を最大化するために、サンプルサイズを最大化するというインテリジェントな推奨にもつながります。 これにより、効果サイズの信頼区間に基づく同様のアプローチが、仮定テスト、特に正規性テストに関してそれほど広く採用されないのはなぜでしょうか。 質問: データが正常性に違反している程度の最良の単一インデックスは何ですか? それとも、正規性違反の複数の指標(たとえば、歪度、尖度、異常値の有病率)について話した方が良いですか? インデックスの信頼区間はどのように計算できますか(またはおそらくベイジアンアプローチ)? 正常性の違反の程度を示すために、そのインデックスのポイントにどのような種類の口頭ラベルを割り当てることができますか(軽度、中程度、強い、極端など)?このようなラベルの目的は、正規性の違反が問題となる場合の直感を訓練する経験の少ないアナリストを支援することです。

5
正規性のすべての検定が帰無仮説を棄却するのはなぜですか?
コルゴモロフ-スミルノフ検定、シャピロ検定など…すべて、分布が正常であるという仮説を棄却します。しかし、通常の変位値とヒストグラムをプロットすると、データは明らかに正常です。テストの力が高いからでしょうか? 標本サイズは約650です。したがって、これらのテストの少なくとも1つが帰無仮説を棄却できないのではないでしょうか。 結果: Kolmogorov-Smirnov D 0.05031 Pr > D <0.010 Cramer-von Mises W-Sq 0.30003 Pr > W-Sq <0.005 Anderson-Darling A-Sq 1.66965 Pr > A-Sq <0.005 Chi-Square Chi-Sq 3250.43596 18 Pr > Chi-Sq <0.001


2
場合
私は声明を証明しようとしています: もし及びの独立確率変数であり、Y 〜N(0 、σ 2 2)バツ〜N( 0 、σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y〜N( 0 、σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) その場合、も正規確率変数です。バツYバツ2+ Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 特殊なケース(たとえば)の場合、というよく知られている結果が得られますいつでも及び独立している変数。実際、は独立した変数です。X Yσ1= σ2= σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYN(0、σ2)XYバツYバツ2+ Y2√〜N( 0 、σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)バツXXYYYN( 0 、σ2)N(0,σ2)\mathcal{N}(0,\sigma^2) N(0、σ2バツYバツ2+ Y2√、X2− Y22 X2+ Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N( 0 、σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最後の結果の証明は、変換続きます。ここで、および。確かに、ここではおよび。目の前の問題のこの証拠を模倣しようとしましたが、乱雑になっているようです。X = R COS θ 、Y = Rの罪θ U = R(X、Y)→ (R 、Θ )→ (U、V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x = r cosθ 、y= r sinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetaU=XYu = …

4
エラーが正規分布していない場合、最小二乗法と最尤法の回帰法が等しくないのはなぜですか?
タイトルはそれをすべて言います。モデルのエラーが正規分布している場合、最小二乗と最大尤度は回帰係数に対して同じ結果になることを理解しています。しかし、エラーが正常に分布していない場合はどうなりますか?なぜ2つの方法が同等ではなくなったのですか?

1
データを過剰適合させずに最適な適合を選択するにはどうすればよいですか?N正規関数などによる二峰性分布のモデリング
私は明らかに二峰性の値の分布を持っています。データは、2つの通常の関数(バイモーダル)または3つの通常の関数のいずれかにうまく適合できます。さらに、データを3でフィッティングするのにもっともらしい物理的な理由があります。 導入されるパラメータが多いほど、フィットはより完璧になります。十分な定数があれば、「象にフィット」できます。 これが分布であり、3つの正規(ガウス)曲線の合計に適合します。 これらは各適合のデータです。適合を判断するためにここでどのテストを適用する必要があるかわかりません。データは91点で構成されています。 1通常機能: RSS:1.06231 X ^ 2:3.1674 Fテスト:0.3092 2通常の機能: RSS:0.010939 X ^ 2:0.053896 F.テスト:0.97101 3通常機能: RSS:0.00536 X ^ 2:0.02794 Fテスト:0.99249 これらの3つの近似のどれが最適かを決定するために適用できる正しい統計検定は何ですか?明らかに、1つの通常の関数近似は不十分です。では、どうすれば2と3を区別できますか? 加えて、私は主にこれをExcelと小さなPythonで行っています。私はまだRや他の統計言語に慣れていません。

1
最小リスク分類子の計算しきい値?
2つのクラスとに属性あり、分布がととします。次のコストマトリックスの前のが等しい場合:、C 2、X N(0 、0.5 )N(1 、0.5 )P (C 1)= P (C 2)= 0.5C1C1C_1C2C2C_2xxxN(0,0.5)N(0,0.5) \cal{N} (0, 0.5)N(1,0.5)N(1,0.5) \cal{N} (1, 0.5)P(C1)=P(C2)=0.5P(C1)=P(C2)=0.5P(C_1)=P(C_2)=0.5 L=[010.50]L=[00.510]L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} なぜ、は最小リスク(コスト)分類器のしきい値ですか?x0&lt;0.5x0&lt;0.5x_0 < 0.5 これは私が誤解している私のメモの例です(つまり、このしきい値にどのように到達したのですか?) 編集1:尤度比のしきい値には、P(C1)/ P(C2)を使用できると思います。 編集2:しきい値に関するいくつかのテキストをパターンのDuda Bookから追加します。

1
収束が速いのは、平均と中央値のどちらですか。
N(0,1)からiid変数を描くと、平均または中央値はより速く収束しますか?どれくらい速く? 具体的には、をN(0,1)から取得したiid変数のシーケンスとします。とをの中央値として定義し。とどちらが0に早く収束しますか?ˉ X N = 1x1,x2,…x1,x2,…x_1, x_2, \ldots 〜X nは{X1、xは2、...xはN}{ ˉ X N}{〜X N}x¯n=1n∑ni=1xix¯n=1n∑i=1nxi\bar{x}_n = \frac{1}{n}\sum_{i=1}^n x_ix~nx~n\tilde{x}_n{x1,x2,…xn}{x1,x2,…xn}\{x_1, x_2, \ldots x_n\}{x¯n}{x¯n}\{\bar{x}_n\}{x~n}{x~n}\{\tilde{x}_n\} より速く収束することの意味について具体的に言うと、存在しますか?もしそうなら、それは何ですか?limn→∞Var(X¯n)/Var(X~n)limn→∞Var(X¯n)/Var(X~n)\lim_{n \to \infty} Var(\bar{X}_n)/Var(\tilde{X}_n)

2
標準偏差が独立変数でスケーリングするレートを推定する
正規分布変数測定を行っている実験があります。YYY Y∼N(μ,σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) しかし、以前の実験は、標準偏差といういくつかの証拠が提供された独立変数のアフィン関数であるXを、すなわち、σσ\sigmaXXX σ=a|X|+bσ=a|X|+b\sigma = a|X| + b Y∼N(μ,a|X|+b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) Xの複数の値でYをサンプリングすることにより、パラメーターおよびbを推定したいと思います。さらに、実験の制限により、Yの限られた数(約30〜40)のサンプルしか取得できず、無関係な実験上の理由から、Xのいくつかの値でサンプリングすることを好みます。これらの制約がある場合、aとbを推定するためにどのような方法が利用できますか?aaabbbYYYXXXYYYXXXaaabbb 実験の説明 これは、上記の質問をする理由に興味がある場合の追加情報です。私の実験では、聴覚と視覚の空間知覚を測定します。さまざまな場所からの聴覚的または視覚的なターゲットを提示できる実験設定があり、被験者はターゲットの知覚された場所Yを示します。上記のσとしてモデル化した離心率の増加(つまり| X |の増加)により、ビジョン*とオーディションの両方の精度が低下します。結局、aとbを見積もりたいXXXYYY|X||X||X|σσ\sigmaaaabbbビジョンとオーディションの両方のために、私は空間内のさまざまな場所にわたる各感覚の精度を知っています。これらの推定値は、同時に提示される場合に視覚的および聴覚的ターゲットの相対的な重み付けを予測するために使用されます(ここで提示される多感覚統合の理論と同様:http : //www.ncbi.nlm.nih.gov/pubmed/12868643)。 *中心窩空間と中心窩外空間を比較すると、このモデルは視覚に対して不正確であることがわかっていますが、私の測定値は中心窩空間にのみ制限されています。これはまともな近似です。

1
2D正規分布の半径のサンプリング分布
平均および共分散行列の2変量正規分布は、半径および角度極座標でことができます。私の質問は、のサンプリング分布とは何ですか、つまり、サンプルの共分散行列与えられたに、点から推定中心までの距離のサンプリング分布は何ですか?Sμμ\muΣΣ\Sigmaθ R X ˉ Xrrrθθ\thetar^r^\hat{r}xxxx¯x¯\bar{x}SSS 背景:ポイントから平均までの真の距離は、ホイト分布に従います。固有値との、及び、その形状パラメータである、およびそのスケールパラメータはです。累積分布関数は、2つのMarcum Q関数の対称差であることがわかっています。rrrxxxλ 1、λ 2 Σ λ 1 &gt; λ 2、Q = 1μμ\muλ1,λ2λ1,λ2\lambda_{1}, \lambda_{2}ΣΣ\Sigmaλ1&gt;λ2λ1&gt;λ2\lambda_{1} > \lambda_{2}q=1(λ1+λ2)/λ2)−1√q=1(λ1+λ2)/λ2)−1q=\frac{1}{\sqrt{(\lambda_{1}+\lambda_{2})/\lambda_{2})-1}}ω=λ1+λ2ω=λ1+λ2\omega = \lambda_{1} + \lambda_{2} シミュレーションは、および推定およびを真のcdfにプラグインすると、大きなサンプルでは機能するが、小さなサンプルでは機能しないことを示唆しています。次の図は、200回の結果を示していますx¯x¯\bar{x}SSSμμ\muΣΣ\Sigma 指定された(軸)、(行)、および変位値(列)の各組み合わせについて、20個の2D法線ベクトルをシミュレートしますqqqxxxωω\omega 各サンプルについて、観測された半径からの特定の分位数を計算し r^r^\hat{r}x¯x¯\bar{x} 各サンプルについて、理論的なホイトから分位数(2D正常)累積分布関数を計算し、サンプル推定値をプラグインした後理論レイリーCDFからと。x¯x¯\bar{x}SSS 以下のように(分布が円形になる)、1に近づき、推定ホイトの位数は影響を受けない推定レイリー分位近づく。、特に分布のテールにおける経験的分位と推定するものが増加との間に、差異を、成長します。Q ωqqqqqqωω\omega

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.