タグ付けされた質問 「quasi-likelihood」

2
準二項分布とは何ですか(GLMのコンテキストで)?
準二項分布とは何か、それが何をするのか、直感的な概要を誰かが提供できることを望んでいます。私は特にこれらの点に興味があります: 準二項分布が二項分布とどのように異なるか。 応答変数がプロポーションの場合(例の値には0.23、0.11、0.78、0.98が含まれます)、準二項モデルはRで実行されますが、二項モデルは実行されません。 TRUE / FALSE応答変数が過度に分散しているときに準二項モデルを使用する理由。

1
GLMの準ポアソンが負の二項分布の特殊なケースとして扱われないのはなぜですか?
私は、一般化線形モデルを、過剰分散の場合とそうでない場合のあるカウントデータのセットに適合させようとしています。ここで適用される2つの正準分布は、ポアソンおよび負の二項(Negbin)、EVおよび分散ですμμ\mu VRP= μVarP=μVar_P = \mu VRNB= μ + μ2θVarNB=μ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} これは、それぞれglm(..,family=poisson)とを使用してRに適合させることができますglm.nb(...)。quasipoisson私の理解では同じEVと分散を持つ調整されたポアソンである家族もあります VRQ P= φ μVarQP=ϕμVar_{QP} = \phi\mu、 すなわち、ポアソンとネビンの間のどこかに落ちます。準ポアソンファミリの主な問題は、それに対応する尤度がないことであり、したがって、非常に有用な統計的検定と適合度測定(AIC、LRなど)の多くが利用できません。 QPとNegbinの分散を比較すると、置くことでそれらを等化できることに気付くかもしれません。このロジックを続けると、準ポアソン分布をNegbinの特殊なケースとして表現することができます。ϕ = 1 + μθϕ=1+μθ\phi = 1 + \frac{\mu}{\theta} Q P(μ 、ϕ )= NB(μ 、θ = μϕ − 1)QP(μ、ϕ)=NB(μ、θ=μϕ−1)QP\,(\mu,\phi) = NB\,(\mu,\theta = \frac{\mu}{\phi-1})、 すなわち、線形に依存する持つNegbin です。上記の式に従ってランダムな数列を生成し、それを当てはめることにより、このアイデアを検証しようとしました:μθθ\thetaμμ\muglm #fix parameters phi = …

3
準最尤推定(QMLE)の背後にあるアイデアと直感
質問:準最尤推定(QMLE、擬似最尤推定、PMLEとも呼ばれます)の背後にある考え方と直感は何ですか?実際の誤差分布が想定誤差分布と一致しない場合、推定器が機能する理由は何ですか? QMLE のWikipediaサイトは素晴らしい(簡潔で、直感的、要点)ですが、もっと直感的で詳細な、おそらくはイラストを使用することもできます。他の参考文献は大歓迎です。(私はQMLE上に材料を探してかなりの数の計量経済学の教科書の上に行くのを覚えて、そして私の驚きに、QMLEは、1つまたはそれらの2で覆われていた、例えばWooldridge 「クロスセクションとパネルデータの計量経済分析」第13章(2010)セクション11、ページ502-517。)

2
カウントデータと過剰分散を伴う回帰におけるポアソンまたは準ポアソン?
カウントデータがあります(多くの要因に応じて、場合によっては顧客の数をカウントするデマンド/オファー分析)。通常のエラーで線形回帰を試みましたが、QQプロットはあまり良くありません。答えのログ変換を試みました:もう一度、悪いQQプロット。 だから今、私はポアソンエラーで回帰を試みています。すべての重要な変数を含むモデルでは、次のようになります。 Null deviance: 12593.2 on 53 degrees of freedom Residual deviance: 1161.3 on 37 degrees of freedom AIC: 1573.7 Number of Fisher Scoring iterations: 5 残留偏差は、残留自由度よりも大きくなります。過剰分散があります。 準ポアソンを使用する必要があるかどうかを知るにはどうすればよいですか?この場合の準ポアソンの目標は何ですか?クローリーによる「The R Book」でこのアドバイスを読みましたが、私の場合、その点や大きな改善は見当たりません。

2
GLMの分散テストは実際に*有用*ですか?
GLMの「過剰分散」の現象は、応答変数の分散を制限するモデルを使用するたびに発生し、データはモデルの制限が許容するよりも大きな分散を示します。これは、ポアソンGLMを使用してカウントデータをモデル化するときによく発生し、よく知られたテストで診断できます。過剰分散の統計的に有意な証拠があることがテストで示された場合、通常、元のモデルで発生する制限から分散パラメーターを解放するより広範な分布ファミリーを使用してモデルを一般化します。ポアソンGLMの場合、負の二項または準ポアソンGLMのいずれかに一般化するのが一般的です。 この状況には明らかな異議があります。なぜポアソンGLMから始めるのですか?(比較的)自由な分散パラメーターを持つより広い分布形式から直接始めて、分散パラメーターをデータに適合させ、過剰分散テストを完全に無視することができます。データ分析を行う他の状況では、少なくとも最初の2モーメントの自由度を許可する分布形式をほぼ常に使用しますが、なぜここで例外を設けるのですか? 私の質問:分散を修正する分布(ポアソン分布など)から始めて、過剰分散テストを実行する正当な理由はありますか?この手順は、この演習を完全にスキップして、より一般的なモデル(たとえば、負の二項分布、準ポアソンなど)に直接進むことと比較してどうですか?言い換えれば、なぜ自由分散パラメーターを持つ分布を常に使用しないのですか?

1
ロジスティック回帰と分数応答回帰の違いは何ですか?
私の知る限り、ロジスティックモデルと分数応答モデル(frm)の違いは、frmが[0,1]であるがロジスティックが{0、1}である従属変数(Y)であるということです。さらに、frmは準尤度推定器を使用してそのパラメーターを決定します。 通常、を使用glmしてロジスティックモデルを取得できますglm(y ~ x1+x2, data = dat, family = binomial(logit))。 frmの場合、に変更family = binomial(logit)しfamily = quasibinomial(logit)ます。 family = binomial(logit)同じ推定値が得られるため、frmのパラメーターの取得にも使用できることに気付きました。次の例をご覧ください library(foreign) mydata <- read.dta("k401.dta") glm.bin <- glm(prate ~ mrate + age + sole + totemp, data = mydata ,family = binomial('logit')) summary(glm.bin) 戻り、 Call: glm(formula = prate ~ mrate + age + …

1
ポアソン回帰の過分散に対処する方法:準尤度、負の二項GLM、または被験者レベルのランダム効果?
ポアソン応答変数の過分散とすべての固定効果開始モデルに対処するための3つの提案に出会いました。 準モデルを使用します。 負の二項GLMを使用します。 被験者レベルのランダム効果を持つ混合モデルを使用します。 しかし、実際に選択するのはなぜですか?これらの間に実際の基準はありますか?

1
ポアソンモデルと準ポアソンモデルで推定された同一の係数
保険環境で請求件数データをモデル化する際に、私はポアソンから始めましたが、その後、過剰分散に気付きました。準ポアソンは、基本的なポアソンよりも大きい平均分散関係をよりよくモデル化しましたが、係数はポアソンモデルと準ポアソンモデルの両方で同一であることに気付きました。 これがエラーでない場合、なぜこれが起こっているのですか?ポアソンよりも準ポアソンを使用する利点は何ですか? 注意事項: 根本的な損失は過剰ベースであり、それが(私は)Tweedieの動作を妨げました-しかし、それは私が試した最初の分布でした。また、NB、ZIP、ZINB、およびハードルモデルを調べましたが、それでもQuasi-Poissonが最適であることがわかりました。 AERパッケージのdispersiontestを使用して過分散をテストしました。私の分散パラメーターは約8.4で、p値は10 ^ -16の大きさでした。 family = poissonまたはquasipoissonでglm()を使用し、コードのログリンクを使用しています。 ポアソンコードを実行すると、「In dpois(y、mu、log = TRUE):non-integer x = ...」という警告が表示されます。 Benのガイダンスによる有用なSEスレッド: ポアソン回帰におけるオフセットの基本的な数学 係数のオフセットの影響 共変量としての露出とオフセットの使用の違い

1
負の二項モデルと準ポアソンの比較
仮説検定アプローチに基づいて、負の二項モデルと準ポアソンモデルを実行しました。両方の方法を使用する私の最終モデルには、異なる共変量と交互作用があります。どちらの場合も残差をプロットするときにパターンがないようです。したがって、準ポアソンには可能性またはAICがないため、どのモデルが私のデータによりよく適合するかを確認するためにどのテストを使用できるか疑問に思いました… また、私は負の二項式がより適切であると私に思わせる過剰分散がたくさんありますが、常識に基づいてモデルを選択できるかどうかわかりません…

2
統計におけるベクトル計算
今学期は、いくつかの変数の関数の統合とベクトル計算についてクラスを教えています。このクラスはほとんどの経済学専攻と工学専攻で構成されており、数学や物理学の専門家もいます。私はこの学期を前学期に教えました、そして、経済学専攻の多くは後半にかなり退屈であることがわかりました。共同で分布した確率変数を使用していくつかの計算を行うことで、複数の積分を動機づけることができましたが、コースのベクトル分析の部分については、物理学に基づいて考えることができる唯一の動機付けでした。 だから、誰かがベクトル計算の主要な定理のいずれかの統計的/確率論的解釈を知っているかどうか疑問に思っています:グリーンの定理、ストークスの定理、そして発散の定理。問題の一部は、発散、勾配、またはカールは言うまでもなく、確率論ではベクトル場があまり頻繁に出現しないように見えることです。数日前にこの質問をmath.stackexchangeにも投稿しましたが、まだ他のアイデアを探しています。

1
分散=とベータ回帰と準GLMの違いは何である
まず、背景を説明しましょう。最後に質問をまとめます。 その平均値によってパラメータベータ分布、及びφは、持っているヴァー(Y )= V (μ )/(φ + 1 )、V (μ )= μ (1 - μは)分散関数です。μμ\muϕϕ\phiVar(Y)=V(μ)/(ϕ+1)Var⁡(Y)=V⁡(μ)/(ϕ+1)\operatorname{Var}(Y) = \operatorname{V}(\mu)/(\phi+1)V(μ)=μ(1−μ)V⁡(μ)=μ(1−μ)\operatorname{V}(\mu) = \mu(1-\mu) ベータ回帰(例えば、Rにbetaregパッケージを使用)において、回帰は、ベータ分布の誤差を想定し、固定効果との値を推定。ϕϕ\phi GLM回帰では、の分散機能と「準」分布を定義することが可能である。したがって、ここでのモデルは、ベータと同じ分散関数を持つエラーを想定しています。次に、回帰は固定効果と準分布の「分散」を推定します。μ(1−μ)μ(1−μ)\mu(1-\mu) 重要なものが欠けているかもしれませんが、これらの2つの方法は本質的に同じで、おそらく推定方法が異なるだけのようです。 Iは間隔である「類似性」と呼ばれるDV、上退縮、Rの両方の方法を試みた:(0,1)(0,1)(0,1) Call: betareg(formula = Similarity ~ N + NK + Step_ent, data = TapData, link = "logit") Coefficients (mean model with logit link): Estimate Std. Error z value …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.