タグ付けされた質問 「gamma-distribution」

2つの厳密に正のパラメーターによってインデックスが付けられた非負の連続確率分布。

4
ガンマGLMを使用する場合
ガンマ分布はかなり広い範囲の形状をとることができ、その2つのパラメーターを介した平均と分散の間のリンクを考えると、非負データの不均一分散に対処するのに適しているようです。 WLSまたは何らかの不均一分散一貫性のあるVCV推定器を使用しないでください。 日常的な非負のデータモデリングにもっと使用しますが、それを使用する人は誰も知りません。正式な教室で学んだことはなく、読んだ文献では決して使用していません。「ガンマGLMの実際的な使用」のようなものをGoogleで検索するたびに、ポアソンイベント間の待機時間に使用するようにアドバイスします。OK。しかし、それは制限的なようであり、その唯一の使用法ではありません。 単純に言えば、ガンマGLMは、ガンマの柔軟性を考慮すると、非負データをモデル化するための比較的仮定の軽い手段のようです。もちろん、他のモデルと同様にQQプロットと残差プロットを確認する必要があります。しかし、私が見逃している深刻な欠点はありますか?「単にOLSを実行する」人々へのコミュニケーションを超えて?

4
ログ変換された応答変数のLMとGLMの選択
一般化線形モデル(GLM)対線形モデル(LM)を使用する背後にある哲学を理解しようとしています。以下にサンプルデータセットを作成しました。 log(y)=x+εlog⁡(y)=x+ε\log(y) = x + \varepsilon この例には、yの大きさの関数としての誤差がないため、対数変換されたyの線形モデルが最適であると想定します。以下の例では、これは実際にそうです(私は思う)-ログ変換されたデータのLMのAICが最も低いからです。対数リンク関数を使用したガンマ分布GLMのAICは、より低い二乗和(SS)を持ちますが、自由度を追加するとAICがわずかに高くなります。ガウス分布のAICが非常に高いことに驚かされました(SSはモデルの中で最低ですが)。εε\varepsilonyyy GLMモデルにアプローチするタイミングについてアドバイスをもらいたいと思います。つまり、LMモデルの近似残差で、別の分布がより適切であることを確認する必要があるのでしょうか。また、適切なディストリビューションファミリを選択するには、どのように進める必要がありますか。 あなたの助けに前もって感謝します。 [編集]:対数変換線形モデルのSSが対数リンク機能を備えたGLMモデルに匹敵するように、要約統計を調整しました。統計のグラフが表示されます。 例 set.seed(1111) n <- 1000 y <- rnorm(n, mean=0, sd=1) y <- exp(y) hist(y, n=20) hist(log(y), n=20) x <- log(y) - rnorm(n, mean=0, sd=1) hist(x, n=20) df <- data.frame(y=y, x=x) df2 <- data.frame(x=seq(from=min(df$x), to=max(df$x),,100)) #models mod.name <- "LM" assign(mod.name, lm(y …

3
どちらが重い尾、対数正規またはガンマを持っていますか?
(これは、電子メールで私に届いた質問に基づいています。同じ人との以前の短い会話からいくつかのコンテキストを追加しました。) 昨年、ガンマ分布は対数正規分布よりも裾が重いと言われましたが、そうではないと言われました。 どちらが重いですか? 関係を調べるために使用できるリソースは何ですか?

4
Rの非負変数の密度プロットの良い方法は?
plot(density(rexp(100)) 明らかに、ゼロの左側のすべての密度はバイアスを表します。 私は非統計学者のためにいくつかのデータを要約したいと思っています。そして、非負データがゼロの左側の密度を持っている理由についての質問を避けたいです。プロットはランダム化チェック用です。治療グループと対照グループごとの変数の分布を示したい。分布はしばしば指数関数的です。ヒストグラムにはさまざまな理由で注意が必要です。 グーグルで簡単に検索すると、非負のカーネルに関する統計学者の研究が得られます。 例: this しかし、Rに実装されているものはありますか?実装されたメソッドのうち、記述統計に関して何らかの方法で「最良」のメソッドはありますか? 編集:fromコマンドが現在の問題を解決できる場合でも、非負の密度推定に関する文献に基づいて誰かがカーネルを実装しているかどうかを知ることは素晴らしいことです

4
ガンマ確率変数の一般的な合計
同じスケールパラメーターを持つガンマ確率変数の合計が別のガンマ確率変数であることを読みました。また、Moschopoulosによる、ガンマランダム変数の一般的なセットを合計する方法を説明する論文を見ました。Moschopoulosのメソッドを実装しようとしましたが、まだ成功していません。 ガンマランダム変数の一般的なセットの合計はどのように見えますか?この質問を具体的にするために、それは次のように見えます: ガンマ(3 、1 )+ ガンマ(4 、2 )+ ガンマ(5 、1 )ガンマ(3、1)+ガンマ(4、2)+ガンマ(5、1)\text{Gamma}(3,1) + \text{Gamma}(4,2) + \text{Gamma}(5,1) 上記のパラメータが特に明らかになっていない場合は、他のものを提案してください。

2
ガンマ対対数正規分布
ガンマ分布または対数正規分布と非常によく似た実験的に観察された分布があります。対数正規分布は、の平均と分散が固定されているランダム変量の最大エントロピー確率分布であることを読みました。ガンマ分布には同様の特性がありますか?XXXln(X)ln⁡(X)\ln(X)

5
一般的な分布の実際の例
私は統計に興味を持っている大学院生です。私は素材全体が好きですが、実際の生活への応用について考えるのに苦労することがあります。具体的には、私の質問は一般的に使用される統計分布(通常-ベータガンマなど)についてです。場合によっては、分布を非常に良くする特定のプロパティ、たとえば指数関数のメモリレスプロパティを取得すると思います。しかし、他の多くの場合、私は教科書に見られる一般的な分布の重要性と応用分野の両方について直観を持っていません。 おそらく、私の懸念に対処する多くの優れた情報源があります。それらを共有していただければ幸いです。現実の例と関連付けることができれば、私はこの資料にもっとや​​る気が出ます。

3
ガンマ分布と正規分布の関係
最近、平均が0の正規確率変数の2乗のpdfを導出する必要があることがわかりました。何らかの理由で、事前に分散を正規化しないことを選択しました。これを正しく行った場合、このpdfは次のようになります。 N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} これは、実際にはガンマ分布のパラメータ化にすぎないことに気付きました。 N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2) そして、2つのガンマ(同じスケールパラメーター)の合計が別のガンマに等しいという事実から、そのガンマは 2乗正規確率変数の合計に等しいということになります。kkk N2Σ(x;k,σ2)=Gamma(x;k2,2σ2)NΣ2(x;k,σ2)=Gamma⁡(x;k2,2σ2) N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2) これは私には少し驚きでした。私が知っていたにもかかわらず乗の和の分布-分布の標準的な通常のRV車を-私は、ガンマは基本的に通常の合計を可能にだけ一般化したことに気づかなかった、ガンマの特殊なケースでした任意の分散のランダム変数。これは、指数分布が2つの正規分布の2乗の和に等しいなど、これまでに出会ったことのない他の特性化にもつながります。χ2χ2\chi^2 これはすべて私にとってやや不思議です。上記で説明したように、正規分布はガンマ分布の導出の基本ですか?私がチェックしたほとんどのリソースは、2つの分布が本質的にこのように関連していること、またはその点についてもガンマの導出方法を説明していません。これにより、複雑な方法で単純に強調した下位レベルの真実がいくつかあると思いますか?

2
family = GammaでGLMのパラメーターを解釈する方法
この質問は、相互検証で回答できるため、Stack Overflowから移行されました。 5年前に移行され ました。 ガンマ分布従属変数を持つGLMのパラメーターの解釈に関して質問があります。これは、ログリンクを使用してGLMに対してRが返すものです。 Call: glm(formula = income ~ height + age + educat + married + sex + language + highschool, family = Gamma(link = log), data = fakesoep) Deviance Residuals: Min 1Q Median 3Q Max -1.47399 -0.31490 -0.05961 0.18374 1.94176 Coefficients: Estimate Std. Error t value Pr(>|t|) …

2
GLMの特定のファミリの使用を検証できる診断はどれですか?
これはとても初歩的なように思えますが、私はこの時点で常に行き詰まります… 私が扱うデータのほとんどは非正常であり、ほとんどの分析はGLM構造に基づいています。現在の分析では、「歩行速度」(メートル/分)の応答変数があります。OLSを使用できないことは簡単にわかりますが、どの家族(ガンマ、ワイブルなど)が適切かを判断するのは非常に不確実です! Stataを使用して、残差と不均一分散、残差と適合値などの診断を調べます。 カウントデータはレート(例:発生率)の形式を取り、ガンマ(過剰分散離散負二項モデルのアナログ)を使用できることを認識していますが、「喫煙銃」で「はい、正しい」と言いたいだけです。家族。これを行うには、標準化された残差と適合値を比較するのが唯一の最善の方法ですか?混合モデルを使用してデータの階層を説明したいのですが、最初に、どの変数が私の応答変数を最もよく説明しているかを整理する必要があります。 任意の助けに感謝します。Stata言語は特に高く評価されています!

3
からサンプリングする方法は
密度f (a )∝ c a d a − 1に従ってサンプリングしたい f(a )∝ cada − 1Γ (a )1(1 、∞ )(a)f(a)∝cada−1Γ(a)1(1,∞)(a) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) ここで、cccとdddは厳密に正です。(動機:これは、ガンマ密度の形状パラメーターが均一な事前分布を持つ場合のギブスサンプリングに役立ちます。) 誰でもこの密度から簡単にサンプリングする方法を知っていますか?たぶんそれは標準的なもので、私が知らないことなのでしょうか? 私は、多かれ少なかれ仕事(モードを見つけるでしょう愚かな拒絶sampliingアルゴリズムと考えることができます*のF、サンプル(、U )大きな箱に均一からを[ 0 、10 * ] × [ 0 、F (A ∗)]およびu > f (a ))の場合は拒否しますが、(i)それはまったく効率的ではなく、(ii)f (a ∗)a∗a∗a^*fff(a,u)(a,u)(a,u)[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]u>f(a)u>f(a)u>f(a)f(a∗)f(a∗)f(a^*)コンピュータが大きすぎて、適度に大きいおよびdでも簡単に処理できません。(大きなcとdのモードはおよそa = c dであることに注意してください。)cccdddcccddda=cda=cda=cd 助けてくれてありがとう!

2
サンプル平均と標準偏差を使用したガンマ分布パラメーターの推定
私は、データサンプルに最適なガンマ分布のパラメーターを推定しようとしています。実際の値ではなく、データサンプルのmean、std(およびそれゆえvariance)のみを使用したいのです-これらはアプリケーションで常に利用できるとは限らないからです。 このドキュメントによれば、次の式を適用して形状とスケールを推定できます。 私は自分のデータでこれを試しましたが、Pythonプログラミングライブラリを使用して実際のデータにガンマ分布をフィッティングするのと比較すると、結果は大きく異なります。 データ/コードを添付して、当面の問題を示します。 import matplotlib.pyplot as plt import numpy as np from scipy.stats import gamma data = [91.81, 10.02, 27.61, 50.48, 3.34, 26.35, 21.0, 79.27, 31.04, 8.85, 109.2, 15.52, 11.03, 41.09, 10.75, 96.43, 109.52, 33.28, 7.66, 65.44, 52.43, 19.25, 10.97, 586.52, 56.91, 157.18, 434.74, 16.07, 334.43, 6.63, 108.41, 4.45, …

3
指数に従うランダム変数の合計がガンマに続き、パラメーターによって混乱します
ガンマ分布に従う指数ランダム変数の合計を学びました。 しかし、パラメータ化はどこでも異なります。たとえば、Wikiは関係を説明していますが、それらのパラメーターが実際に何を意味するのかを述べませんか?形状、スケール、レート、1 /レート? 指数分布: xバツx〜exp(λ)eバツp(λ)exp(\lambda) f(x|λ)=λe−λxf(バツ|λ)=λe−λバツf(x|\lambda )=\lambda {{e}^{-\lambda x}} E[x]=1/λE[バツ]=1/λE[x]=1/ \lambda var(x)=1/λ2var(バツ)=1/λ2var(x)=1/{{\lambda}^2} ガンマ分布:Γ(shape=α,scale=β)Γ(形状=α、規模=β)\Gamma(\text{shape}=\alpha, \text{scale}=\beta) f(x|α,β)=1βα1Γ(α)xα−1e−xβf(バツ|α、β)=1βα1Γ(α)バツα−1e−バツβf(x|\alpha ,\beta )=\frac{1}{{{\beta }^{\alpha }}}\frac{1}{\Gamma (\alpha )}{{x}^{\alpha -1}}{{e}^{-\frac{x}{\beta }}} E[x]=αβE[バツ]=αβE[x]=\alpha\beta var[x]=αβ2var[バツ]=αβ2var[x]=\alpha{\beta}^{2} この設定で、何ですか?正しいパラメーター化はどうなりますか?これをカイ二乗に拡張してみませんか?∑i=1nxi∑私=1nバツ私\sum\limits_{i=1}^{n}{{{x}_{i}}}

2
ガンマランダム変数の対数の歪度
考えてみましょガンマ確率変数 バツ〜Γ (α 、θ )バツ〜Γ(α、θ)X\sim\Gamma(\alpha, \theta)。平均、分散、歪度にはきちんとした式があります。 E [X]ヴァール[ X]歪度[ X]= α θ= α θ2= 1 / α ⋅ E [ X]2= 2 / α−−√E[バツ]=αθヴァール⁡[バツ]=αθ2=1/α⋅E[バツ]2歪度⁡[バツ]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} ここで、対数変換されたランダム変数考えますY= ログ(X)Y=ログ⁡(バツ)Y=\log(X)。ウィキペディアには、平均と分散の公式があります。 E [Y]ヴァール[ Y]= ψ (α )+ log(θ )= ψ1(α )E[Y]=ψ(α)+ログ⁡(θ)ヴァール⁡[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} ガンマ関数の対数の1次および2次導関数として定義されるディガンマおよびトリガンマ関数を介して。 歪度の式は何ですか? テトラガンマ関数は表示されますか? (これについて不思議に思ったのは、対数正規分布とガンマ分布の選択です。ガンマ対対数正規分布を参照してください。とりわけ、歪度特性が異なります。特に、対数正規の対数の歪度はゼロです。ガンマのログの歪度は負ですが、どの程度負ですか?..)

3
ポアソンは指数関数的であり、ガンマポアソンは何に対してですか?
ポアソン分布は単位時間あたりのイベントを測定でき、パラメーターはです。指数分布は、パラメーター使用して、次のイベントまでの時間を測定します。イベントまたは時間をモデル化する方が簡単かどうかに応じて、ある分布を別の分布に変換できます。λλ\lambda1λ1λ\frac{1}{\lambda} 現在、ガンマポアソンは、より大きな分散を持つ「ストレッチ」ポアソンです。ワイブル分布は、より大きな分散を持つ「ストレッチされた」指数関数です。しかし、これら2つはポアソンを指数関数に変換できるのと同じように、簡単に相互変換できますか? それとも、ガンマポアソン分布と組み合わせて使用​​するのに適した他の分布がありますか? ガンマポアソンは、負の二項分布、またはNBDとも呼ばれます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.