タグ付けされた質問 「gamma-distribution」

2つの厳密に正のパラメーターによってインデックスが付けられた非負の連続確率分布。

1
Yの密度=ガンマ分布Xのlog(X)
この質問はこの投稿に密接に関連しています ランダム変数、を定義するとします。確率密度関数を見つけたいのですが。X∼Gamma(k,θ)X∼Gamma(k,θ)X \sim \text{Gamma}(k, \theta)Y=log(X)Y=log⁡(X)Y = \log(X)YYY 私は当初、累積分布関数Xを定義し、変数を変更し、積分の「内側」を密度として取ると思っていました。 P(X≤c)P(Y≤logc)=∫c01θk1Γ(k)xk−1e−xθdx=∫log(c)log(0)1θk1Γ(k)exp(y)k−1e−exp(y)θexp(y)dyP(X≤c)=∫0c1θk1Γ(k)xk−1e−xθdxP(Y≤log⁡c)=∫log⁡(0)log⁡(c)1θk1Γ(k)exp⁡(y)k−1e−exp⁡(y)θexp⁡(y)dy\begin{align} P(X \le c) & = \int_{0}^{c} \frac{1}{\theta^k} \frac{1}{\Gamma(k)} x^{k- 1} e^{-\frac{x}{\theta}} dx \\ P(Y \le \log c) & = \int_{\log(0)}^{\log(c)} \frac{1}{\theta^k} \frac{1}{\Gamma(k)} \exp(y)^{k- 1} e^{-\frac{\exp(y)}{\theta}} \exp(y) dy \\ \end{align} ここでは、と、と定義に観点からsubを使用しています。y=logxy=log⁡xy = \log xdy=1xdxdy=1xdxdy = \frac{1}{x} dxxxxdxdxdxyyy 残念ながら、出力は1に統合されません。間違いがどこにあるのかわかりません。誰かが私のエラーの場所を教えてもらえますか?

1
階層的ガンマポアソンモデルの超優先密度
データ階層モデルでは、 は、実際には値(ガンマ分布の平均と分散がデータ平均と分散にほぼ一致するように(たとえば、Clayton and Kaldor、1987 "Empirical Bayes Estimates of Age-Standardized Relative Risks for Disease Mapping"、Biometrics)。明らかに、これはアドホックソリューションにすぎません。パラメータに対する研究者の信頼を誇張するためです。yyyy∼Poisson(λ)y∼Poisson(λ)y \sim \textrm{Poisson}(\lambda) λ∼Gamma(α,β)λ∼Gamma(α,β)\lambda \sim \textrm{Gamma}(\alpha, \beta)α,β)α,β)\alpha, \beta)yyy(α,β)(α,β)(\alpha, \beta)また、基礎となるデータ生成プロセスが同じであっても、実現されたデータのわずかな変動がガンマ密度に大きな影響を与える可能性があります。 さらに、Bayesian Data Analysis(2nd Ed)で、Gelmanはこの方法は「だらしない」と書いています。この本とこの論文(p。3232から始まる)では、代わりに、ラット腫瘍の例(p。130から始まる)と同様の方法で、いくつかの超優先密度を選択することを提案しています。p(α,β)p(α,β)p(\alpha, \beta) 有限の事後密度を生成する限りどのも許容できることは明らかですが、過去にこの問題で研究者が使用した超優先密度の例は見つかりませんでした。ポアソンガンマモデルを推定するためにハイパープライオリティを採用した本や記事を誰かに教えてもらえれば幸いです。理想的には、が比較的フラットで、ラットの腫瘍の例のようなデータ、またはいくつかの代替仕様とそれぞれに関連するトレードオフを比較する議論によって支配されることに興味があります。p(α,β)p(α,β)p(\alpha, \beta)p(α,β)p(α,β)p(\alpha, \beta)

2
ゼロ膨張ガンマモデルの適切な使用と解釈
背景:私は現在、細胞発現率のデータセットと格闘している生物統計学者です。この研究では、さまざまなドナーからグループで収集された多数の細胞を特定のペプチドに曝露しました。細胞は、応答して特定のバイオマーカーを発現するか、発現しません。次に、各ドナーグループの応答率が記録されます。応答率(パーセンテージで表される)は関心のある結果であり、ペプチド曝露が予測因子です。 観察はドナー内でクラスター化されることに注意してください。 私は要約データしか持っていないので、私は(少なくとも今のところ)ドナーごとの応答率を連続データとして扱っています。 複雑さは、データにゼロが多数あるという事実から生じます。無視するには多すぎます。ゼロの過剰と結びついて連続データを歪めているという事実に対処するために、ゼロインフレガンマモデルを検討しています。私はTobitモデルも検討しましたが、真のゼロとは対照的に、下限での打ち切りを想定しているため、これは劣っているように見えます(計量経済学者は区別が難しいと言うかもしれません)。 質問:一般的に、ゼロ膨張ガンマモデルを使用するのが適切なのはいつですか?つまり、前提条件は何ですか?そして、その推論をどのように解釈しますか?もしあれば、これを論じている論文へのリンクに感謝します。 私が見つけたSAS-L上のリンクデールMcLerranは、ゼロ膨張したガンマモデルのNLMIXEDコードを提供し、可能であるように思われるが。それにもかかわらず、私は盲目的に起訴することを嫌います。

2
二乗ガンマの期待
ガンマ分布がおよびでパラメーター化されている場合:αα\alphaββ\beta E(Γ(α,β))=αβE(Γ(α,β))=αβ E(\Gamma(\alpha, \beta)) = \frac{\alpha}{\beta} 二乗ガンマの期待値を計算したいと思います。 E(Γ(α,β)2)=?E(Γ(α,β)2)=? E(\Gamma(\alpha, \beta)^2) = ? 私はそうだと思います: E(Γ(α,β)2)=(αβ)2+αβ2E(Γ(α,β)2)=(αβ)2+αβ2 E(\Gamma(\alpha, \beta)^2) = \left(\frac{\alpha}{\beta}\right)^2 + \frac{\alpha}{\beta^2} この後者の表現が正しいかどうか誰かが知っていますか?

2
割合データの分布
データを使用してモデルを作成するために使用する正しい分布について質問があります。私は50区画の森林インベントリを実施しました。各区画は20m×50mです。プロットごとに、地面を遮る樹冠の割合を推定しました。各プロットには、キャノピーカバーの1つの値(パーセント)があります。割合の範囲は0〜0.95です。衛星画像と環境データに基づいた独立したX変数の行列を使用して、樹冠のカバー率(Y変数)のモデルを作成しています。 二項確率変数はn回の独立した試行の合計(つまり、ベルヌーイ確率変数)であるため、二項分布を使用する必要があるかどうかはわかりません。パーセンテージ値は試行の合計ではありません。実際の割合です。上限はありませんが、ガンマを使用する必要がありますか?パーセンテージを整数に変換し、ポアソンをカウントとして使用する必要がありますか?私はガウシアンに固執するべきですか?この方法でパーセンテージをモデル化しようとする文献や教科書には、多くの例はありません。ヒントや洞察は大歓迎です。 回答ありがとうございます。実際、ベータ版の配布はまさに私が必要としているものであり、この記事で徹底的に議論されています: Eskelson、BN、Madsen、L.、Hagar、JC、およびTemesgen、H(2011)。ベータ回帰とコピュラモデルを使用した河岸下層植生被覆の推定。Forest Science、57(3)、212-221。 これらの作者は、Cribari-NetoとZeileisによるRのbetaregパッケージを使用しています。 次の記事では、パーセンテージの範囲に真の0または1が含まれている場合に、ベータ分布の応答変数を変換する適切な方法について説明しています。 Smithson、M.、J。Verkuilen、2006。より良いレモン絞り器?ベータ分布の従属変数を使用した最尤回帰、Psychological Methods、11(1):54–71。

1
指数とガンマの間の分布の名前?
密度ここで、はパラメータであり、指数関数()の間に存在しますおよび()分布。これがたまたま分布のより一般的なファミリの例であるかどうかだけ知りたいですか?そのように私はそれを認識していません。f(s)∝ss+αe−s,s>0f(s)∝ss+αe−s,s>0f(s)\propto \frac{s}{s+\alpha}e^{-s},\quad s > 0α≥0α≥0\alpha \ge 0α=0α=0\alpha=0Γ(2,1)Γ(2,1)\Gamma(2,1)α→∞α→∞\alpha \to \infty

2
ガンマ確率変数の違い
与えられた二つの独立確率変数とY 〜G MをM(α Y、β Y)、差の分布、すなわち何D = X - Yは?バツ〜G A M M A(αバツ、βバツ)X∼Gamma(αX,βX)X\sim \mathrm{Gamma}(\alpha_X,\beta_X)Y〜G A M M A(αY、βY)Y∼Gamma(αY,βY)Y\sim \mathrm{Gamma}(\alpha_Y,\beta_Y)D = X− YD=X−YD=X-Y 結果がよく知られていない場合、どのように結果を導き出しますか?

1
フィットしたグラフとガンマ分布の実際のグラフを1つのプロットで描画する方法は?
必要なパッケージをロードします。 library(ggplot2) library(MASS) ガンマ分布に適合した10,000個の数値を生成します。 x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] xがどの分布に適合するかわからないと仮定して、確率密度関数を描画します。 t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = y)) + theme_classic() グラフから、xの分布がガンマ分布に非常に似ていることがわかるのでfitdistr()、パッケージでを使用してMASS、ガンマ分布の形状と速度のパラメーターを取得します。 fitdistr(x,"gamma") ## output ## shape rate ## 2.0108224880 0.2011198260 ## (0.0083543575) …

3
ガンマ分布からの統計の独立性
ましょは、ガンマ分布G a m m a (α 、β )からのランダムサンプルです。バツ1、。。。、XんX1,...,XnX_1,...,X_nG a m m a(α 、β)Gamma(α,β)\mathrm{Gamma}\left(\alpha,\beta\right) ましょうとS 2は、それぞれ、サンプル平均と標本分散すること。バツ¯X¯\bar{X}S2S2S^2 そして、ということを証明または反証とS 2 / ˉ X 2は独立しています。バツ¯X¯\bar{X}S2/ X¯2S2/X¯2S^2/\bar{X}^2 私の試み:以来、我々はの独立性を確認する必要がありˉXおよび(XIをS2/ X¯2= 1n − 1Σんi = 1(X私バツ¯− 1 )2S2/X¯2=1n−1∑i=1n(XiX¯−1)2S^2/\bar{X}^2 = \frac{1}{n-1} \sum_{i=1}^n \left(\frac{X_i}{\bar{X}}-1\right)^2 バツ¯X¯\bar{X}が、どのように私はそれらの間の独立性を確立する必要がありますか?(X私バツ¯)んi = 1(XiX¯)i=1n\left(\frac{X_i}{\bar{X}} \right)_{i=1}^{n}

1
ガンマファミリーを持つGLMにおけるアルファの実際的な意味は何ですか?
フォームのいくつかのモデルに適合しています。 glm(DV ~ I(1/IV), family = Gamma(link = "log") ..異なる変数について取得したモデルを比較する方法を探しています。アルファ値が実用的かどうか疑問に思っていますか? 以下の3つのプロットの場合、アルファ値は17.85、9.03、6.27です。これらの値には、データを解釈したり、さまざまな変数を比較したりするのに役立つ情報が含まれていますか?


2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

2
ガンマ分布の平均と分散は何ですか?
ガンマ分布には2つの形式があり、それぞれ形状とスケールパラメータの定義が異なります。gsl_ran_gammaの実装にどのフォームが使用されているかを尋ねるよりも、形状とスケールのパラメーターに関して、平均と標準偏差の関連する定義を求める方がおそらく簡単です。 定義へのポインタがあれば幸いです。

2
アイデンティティリンク機能はガンマファミリーのドメインを尊重していませんか?
アイデンティティリンクでガンマ一般化線形モデル(GLM)を使用しています。独立変数は、特定のグループの報酬です。 Pythonのstatsmodelsの概要で、IDリンク関数に関する警告("DomainWarning:IDリンク関数はガンマファミリのドメインを考慮していません。")がわかりません。背景:統計学における基本的な正式な教育のみであり、ロジスティック回帰を超えるGLMの経験はほとんどありません。 関連するPythonコードは次のとおりです。 model=statsmodels.genmod.generalized_linear_model.GLM(target, reducedFeatures, family=sm.families.Gamma(link=sm.families.links.identity)) results=model.fit() print(results.summary()) 出力は次のとおりです。 私の質問はこれです:アイデンティティリンクはどのようにしてガンマファミリのドメインを尊重しませんか?ガンマファミリーのドメインは0から無限大ですか?また、IDリンクはほとんど何も実行していない、つまり独立変数をそのまま維持し、それらを従属変数との関係を変換しないという印象も受けました。うやうやしいリンク機能のように聞こえます;) 修正してください

4
ガンマ周辺分布と AR(1)係数を使用してマルコフ連鎖を作成する方法
合成時系列を生成したい。時系列は、ガンマ周辺分布と AR(1)パラメーターを持つマルコフ連鎖である必要があります。AR(1)モデルのノイズ項としてガンマ分布を使用するだけでこれを実行できますか、それともより高度なアプローチを使用する必要がありますか?ρρ\rho

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.