タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

2
場合
私は声明を証明しようとしています: もし及びの独立確率変数であり、Y 〜N(0 、σ 2 2)バツ〜N( 0 、σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y〜N( 0 、σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) その場合、も正規確率変数です。バツYバツ2+ Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 特殊なケース(たとえば)の場合、というよく知られている結果が得られますいつでも及び独立している変数。実際、は独立した変数です。X Yσ1= σ2= σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYN(0、σ2)XYバツYバツ2+ Y2√〜N( 0 、σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)バツXXYYYN( 0 、σ2)N(0,σ2)\mathcal{N}(0,\sigma^2) N(0、σ2バツYバツ2+ Y2√、X2− Y22 X2+ Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N( 0 、σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最後の結果の証明は、変換続きます。ここで、および。確かに、ここではおよび。目の前の問題のこの証拠を模倣しようとしましたが、乱雑になっているようです。X = R COS θ 、Y = Rの罪θ U = R(X、Y)→ (R 、Θ )→ (U、V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x = r cosθ 、y= r sinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetaU=XYu = …

2
幾何平均は、どの連続分布の平均の不偏推定量ですか?
閉じた形で表現できる連続分布はありますか?その平均は、サンプルの幾何平均がその平均の不偏推定量であるようなものですか? 更新:私はサンプルが正でなければならない(または、幾何平均が存在しない可能性がある)ことに気付いたので、連続は正しい言葉ではないかもしれません。確率変数の負の値に対してはゼロであり、正の値に対しては連続である分布はどうでしょうか。切り捨てられた分布のようなもの。

4
独立した対数正規確率変数の合計は対数正規に見えますか?
観測数を増やすと、2つ(以上)の対数正規確率変数の合計が対数正規分布に近づく理由を理解しようとしています。オンラインで調べたところ、これに関する結果は見つかりませんでした。 明らかに、とが独立した対数正規変数である場合、指数とガウス確率変数の特性により、も対数正規です。ただし、も対数正規であることを示唆する理由はありません。Y X × Y X + YバツバツXYYYバツ× Yバツ×YX \times Yバツ+ Yバツ+YX+Y しかしながら 2つの独立した対数正規確率変数およびYを生成し、Z = X + Yとし、このプロセスを何度も繰り返すと、Zの分布は対数正規に見えます。観測数を増やすと、対数正規分布に近づくように見えます。バツバツXYYYZ= X+ YZ=バツ+YZ=X+YZZZ 例:100万ペアを生成した後、Zの自然対数の分布が以下のヒストグラムに示されます。これは非常に明らかに正規分布に似ており、が実際に対数正規であることを示唆しています。ZZZ 誰かがこれを理解するのに役立つかもしれないテキストへの洞察または参照を持っていますか?

3
周波数についてのベイズ推定における事前のベータ共役の理解
以下は、ボルスタッドの「ベイジアン統計入門」からの抜粋です。 そこにいるすべての専門家にとって、これは些細なことかもしれませんが、ある値の事後確率を計算するために統合を行う必要がないと著者が結論付けている方法はわかりません。比例であり、すべての項がどこから来たのか(尤度x事前)である2番目の式を理解しています。さらに、分子だけが直接比例しているので、分母を気にする必要はありません。しかし、3番目の方程式に移って、ベイズ規則の分母を忘れていませんか?どこに行ったの?そして、ガンマ関数によって計算された値、それは定数ではありませんか?定数はベイズの定理で相殺されませんか?ππ\pi


1
GLMにはいくつのディストリビューションがありますか?
私は、GLMが5つの分布(つまり、ガンマ、ガウス、二項、逆ガウス、およびポアソン)で記述されている教科書の複数の場所を特定しました。これは、Rの家族関数でも例示されています。 追加のディストリビューションが含まれているGLMへの参照に遭遇することがあります(例)。これらの5つがなぜ特別なのか、または常にGLMにあるのか、誰かがなぜ他の人が特別なのかを誰かが説明できますか? 私がこれまでに学んだことから、指数関数的に家族の中でGLM分布フォームにすべて適合: ここで、ϕは分散パラメーター、θは正準パラメーターです。f(y;θ,ϕ)=exp{yθ−b(θ)ϕ+c(y,ϕ)}f(y;θ,ϕ)=exp⁡{yθ−b(θ)ϕ+c(y,ϕ)}f(y;\theta,\phi)=\exp\left\{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\right\}ϕϕ\phiθθ\theta GLMに適合するように分布を変換することはできませんか?

1
データを過剰適合させずに最適な適合を選択するにはどうすればよいですか?N正規関数などによる二峰性分布のモデリング
私は明らかに二峰性の値の分布を持っています。データは、2つの通常の関数(バイモーダル)または3つの通常の関数のいずれかにうまく適合できます。さらに、データを3でフィッティングするのにもっともらしい物理的な理由があります。 導入されるパラメータが多いほど、フィットはより完璧になります。十分な定数があれば、「象にフィット」できます。 これが分布であり、3つの正規(ガウス)曲線の合計に適合します。 これらは各適合のデータです。適合を判断するためにここでどのテストを適用する必要があるかわかりません。データは91点で構成されています。 1通常機能: RSS:1.06231 X ^ 2:3.1674 Fテスト:0.3092 2通常の機能: RSS:0.010939 X ^ 2:0.053896 F.テスト:0.97101 3通常機能: RSS:0.00536 X ^ 2:0.02794 Fテスト:0.99249 これらの3つの近似のどれが最適かを決定するために適用できる正しい統計検定は何ですか?明らかに、1つの通常の関数近似は不十分です。では、どうすれば2と3を区別できますか? 加えて、私は主にこれをExcelと小さなPythonで行っています。私はまだRや他の統計言語に慣れていません。


5
ポアソンでない場合、これはどの分布ですか?
7日間に個人が実行したアクションの数を含むデータセットがあります。特定のアクションは、この質問には関係ありません。:ここでは、データ・セットのためのいくつかの記述統計ある RangeMeanVarianceNumber of observations0−77218.22791696Range0−772Mean18.2Variance2791Number of observations696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & 2791 \\ \hline \text{Number of observations} & 696 \\ \hline \end{array} これはデータのヒストグラムです: データのソースから判断すると、ポアソン分布に適合すると考えました。ただし、平均≠分散、およびヒストグラムは左側に大きく重み付けされています。さらに、私はgoodfitRでテストを実行し、得ました: > gf <- goodfit(actions,type="poisson", method = "MinChisq") <br> > summary(gf) <br> Goodness-of-fit test for poisson …

2
この離散分布(再帰的差分方程式)の名前は何ですか?
コンピューターゲームでこのディストリビューションに出会い、その動作についてもっと知りたいと思いました。これは、特定の数のプレーヤーアクションの後に特定のイベントを発生させるかどうかの決定に基づいています。これ以上の詳細は関係ありません。他の状況にも当てはまるようですが、計算が簡単でロングテールがつくので面白かったです。 ステップごとに、ゲームは均一な乱数ます。場合、その後、イベントがトリガされます。イベントが一度発生すると、ゲームはリセットされ、シーケンスを再度実行します。この問題のイベントの1つの発生にのみ興味があります。これは、ゲームが使用しているディストリビューションを表しているためです。(また、複数の発生に関する質問は、単一の発生モデルで回答できます。)0 ≤ X &lt; 1 、X &lt; P (N )N = 0nnn0≤X&lt;10≤X&lt;10 \leq X < 1X&lt;p(n)X&lt;p(n)X < p(n)n=0n=0n = 0 ここでの主な「異常」は、この分布の確率パラメーターが時間の経過とともに増加するか、言い換えれば、しきい値が時間の経過とともに増加することです。この例では直線的に変化しますが、他のルールを適用できると思います。ステップまたはユーザーによるアクションの後、nnn p(n)=knp(n)=kn p(n) = kn ある定数。ある点、p(n _ {\ max})\ geq 1が得られます。イベントはそのステップで発生することが保証されているだけです。0&lt;k&lt;10&lt;k&lt;10 < k < 1nmaxnmaxn_{\max} p(nmax)≥1p(nmax)≥1p(n_{\max}) \geq 1 私はそれを決定することができました F (n )= p (n )+ F (n - 1 …

2
ポアソン分布は安定しており、MGFの反転式はありますか?
まず、ポアソン分布が「安定」しているかどうかについて質問があります。非常に素朴です(そして「安定した」分布についてはあまり確信がありません)。MGFの積を使用して、ポアソン分散RVの線形結合の分布を計算しました。個々のRVのパラメーターの線形結合に等しいパラメーターを持つ別のポアソンを取得しているようです。したがって、ポアソンは「安定」していると結論付けます。何が欠けていますか? 次に、特性関数の場合と同様にMGFの反転式はありますか?

2
カイ2乗変量の無限コレクションの統計(たとえば、最小)を注文しますか?
今回が初めてなので、フォーマットやタグなど、何らかの形で質問を明確にできるかどうか教えてください。(うまくいけば、後で編集できます!)参照を見つけて、誘導を使用して自分自身を解決しようとしましたが、両方で失敗しました。 私は、自由度の異なる独立した確率変数の無数に無限の集合の次数統計に減少するように見える分布を単純化しようとしています。具体的には、独立した中で番目に小さい値の分布は何ですか? m個χ 2 2、χ 2 4、χ 2 6、χ 2 8、...χ2χ2\chi^2mmmχ22,χ24,χ26,χ28,…χ22,χ42,χ62,χ82,…\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots 特別なケース興味があります:(独立した)の最小値の分布はどうですか?χ 2 2、χ 2 4、χ 2 6、...m=1m=1m=1χ22,χ24,χ26,…χ22,χ42,χ62,…\chi^2_2,\chi^2_4,\chi^2_6,\ldots 最小値の場合、累積分布関数(CDF)を無限積として書くことができましたが、それをさらに単純化することはできません。のCDF が (場合、これにより、期待値2の指数分布との等価性に関する以下の2番目のコメントが確認されます。)最小値のCDFは、として記述できます。 製品の最初の項はであり、「最後の」項は F 2 M(X )= γ (M 、X / 2 )/ Γ (M )= γ (M 、X / 2 )/(M - 1 )!= 1 − e − x / …

3
ggplot2を使用して2つのデータセットをQQプロットと比較する方法は?
統計とRの初心者の両方として、私は1:1のアスペクト比でqqplotを生成しようとするのに本当に苦労しています。ggplot2は、デフォルトのRプロットパッケージよりもはるかに多くのコントロールを提供しているようですが、2つのデータセットを比較するためにggplot2でqqplotを実行する方法がわかりません。 だから私の質問、ggplot2の同等のものは何ですか? qqplot(datset1,dataset2)

2
連続データにポアソン回帰を使用していますか?
ポアソン分布を使用して、連続データと離散データを分析できますか? 応答変数が連続であるいくつかのデータセットがありますが、正規分布ではなくポアソン分布に似ています。ただし、ポアソン分布は離散分布であり、通常は数値またはカウントに関係しています。

3
近似
概算するための最良の方法は何だ与えられた二つの整数のためのmは、nはあなたが平均知っているときμ、分散σ 2、歪度γ 1と過剰尖度γ 2離散分布のXを、そしてそれがあります明確な形状の(非ゼロ)測定からγ 1及びγ 2正規近似が適切でないと?Pr[n≤X≤m]Pr[n≤X≤m]Pr[n \leq X \leq m]m,nm,nm,nμμ\muσ2σ2\sigma^2γ1γ1\gamma_1γ2γ2\gamma_2XXXγ1γ1\gamma_1γ2γ2\gamma_2 通常、私は整数補正付きの通常の近似を使用します... Pr[(n−½)≤X≤(m+½)]=Pr[(n−½)−μσ≤Z≤(m+½)−μσ]=Φ((m+½)−μσ)−Φ((n−½)−μσ)Pr[(n−½)≤X≤(m+½)]=Pr[(n−½)−μσ≤Z≤(m+½)−μσ]=Φ((m+½)−μσ)−Φ((n−½)−μσ)Pr[(n - \text{½})\leq X \leq (m + \text{½})] = Pr[\frac{(n - \text{½})-\mu}{\sigma}\leq Z \leq \frac{(m + \text{½})-\mu}{\sigma}] = \Phi(\frac{(m + \text{½})-\mu}{\sigma}) - \Phi(\frac{(n - \text{½})-\mu}{\sigma}) ...歪度と過剰な尖度が0に近い(近い)場合、ただし、ここではそうではありません。 私は、異なる値を有する異なる離散分布に対して複数の近似を実行する必要が及びγ 2。用途があること手順確立があれば調べることに興味がある私はγ 1およびγ 2を正規近似よりも良い近似を選択するためには。γ1γ1\gamma_1γ2γ2\gamma_2γ1γ1\gamma_1γ2γ2\gamma_2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.