タグ付けされた質問 「generalized-linear-model」

「リンク関数」を介して非線形関係を可能にし、応答の分散を予測値に依存させることができる線形回帰の一般化。(通常の線形モデルを一般的な共分散構造と多変量応答に拡張する「一般線形モデル」と混同しないでください。)

1
GLMとGEEの違いは何ですか?
共変量として被験者と時間を含むバイナリ応答変数を使用したGLMモデル(ロジスティック回帰)と、複数の時点での測定値間の相関を考慮した類似のGEEモデルとの違いは何ですか? 私のGLMは次のようになります。 Y(binary) ~ A + B1X1(subject id) + B2X2(time) + B3X3(interesting continuous covariate) ロジットリンク機能付き。 私は、2つのモデルで時間をどのようにどのように処理するか、および解釈にどのような影響があるかについての簡単な(社会科学者向け)説明を探しています。

1
ポアソン/対数線形モデルの尤度比検定のためにゼロカウントを調整する必要がありますか?
分割表に0がありglm、尤度比検定用にネストされたポアソン/対数線形モデル(R 関数を使用)を近似している場合、glmモデルを近似する前にデータを調整する必要があります(たとえば、すべてに1/2を追加します)カウント)?明らかに、いくつかのパラメータは調整なしでは推定できませんが、調整/調整の欠如はLRテストにどのように影響しますか?

1
Rで2つのglmモデルを組み合わせる簡単な方法はありますか?
で作成されたRのロジスティック回帰モデルが2つありglm()ます。どちらも同じ変数を使用しますが、マトリックスの異なるサブセットを使用して作成されました。係数の平均を与える平均モデルを取得し、これをpredict()関数で使用する簡単な方法はありますか? [この種の質問をプログラミングサイトに投稿する必要がある場合は、お知らせください。投稿します] ありがとう

1
二項モデル(lme4)の変量効果の推定
ランダムロジットでベルヌーイ試験をシミュレートしていますグループとの間で、私と対応するモデルフィットパッケージ:ロジットθ 〜N(ロジットθ0、12)logitθ∼N(logitθ0,12)\text{logit}\, \theta \sim {\cal N}(\text{logit}\, \theta_0, 1^2)lme4 library(lme4) library(data.table) I <- 30 # number of groups J <- 10 # number of Bernoulli trials within each group logit <- function(p) log(p)-log(1-p) expit <- function(x) exp(x)/(1+exp(x)) theta0 <- 0.7 ddd <- data.table(subject=factor(1:I),logittheta=rnorm(I, logit(theta0)))[, list(result=rbinom(J, 1, expit(logittheta))), by=subject] fit <- glmer(result~(1|subject), …

3
GLMで予測子として主成分を使用する方法は?
PCAがGLMの変数選択に使用されていると仮定すると、一般化線形モデル(GLM)で主成分分析(PCA)の出力をどのように使用しますか? 明確化: GLMで相関変数を使用しないようにPCAを使用したいと思います。ただし、PCAを.2*variable1+.5*variable3使用すると、変数1と3をGLMに入力するのに慣れています。PCAは線形結合を提供するので、たとえば、それを新しい変数としてGLMに入れますか(変数1と3による応答の系統的変動を考慮するため)?

1
一般化線形モデル出力から方程式を見つける
特定の要因に基づいて結果の確率を生成し、その結果の曲線をプロットするとします。Rからその曲線の方程式を抽出する方法はありますか? > mod = glm(winner~our_bid, data=mydat, family=binomial(link="logit")) > summary(mod) Call: glm(formula = winner ~ our_bid, family = binomial(link = "logit"), data = mydat) Deviance Residuals: Min 1Q Median 3Q Max -0.7443 -0.6083 -0.5329 -0.4702 2.3518 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -9.781e-01 2.836e-02 -34.49 <2e-16 *** our_bid -2.050e-03 …

2
アイデンティティリンク機能はガンマファミリーのドメインを尊重していませんか?
アイデンティティリンクでガンマ一般化線形モデル(GLM)を使用しています。独立変数は、特定のグループの報酬です。 Pythonのstatsmodelsの概要で、IDリンク関数に関する警告("DomainWarning:IDリンク関数はガンマファミリのドメインを考慮していません。")がわかりません。背景:統計学における基本的な正式な教育のみであり、ロジスティック回帰を超えるGLMの経験はほとんどありません。 関連するPythonコードは次のとおりです。 model=statsmodels.genmod.generalized_linear_model.GLM(target, reducedFeatures, family=sm.families.Gamma(link=sm.families.links.identity)) results=model.fit() print(results.summary()) 出力は次のとおりです。 私の質問はこれです:アイデンティティリンクはどのようにしてガンマファミリのドメインを尊重しませんか?ガンマファミリーのドメインは0から無限大ですか?また、IDリンクはほとんど何も実行していない、つまり独立変数をそのまま維持し、それらを従属変数との関係を変換しないという印象も受けました。うやうやしいリンク機能のように聞こえます;) 修正してください

3
LMの代わりにGLMを使用する場合
線形モデルに対して一般化線形モデルをいつ使用するのですか? 一般化線形モデルでは、たとえば、エラーが通常以外の何らかの分布をもつことができることを知っていますが、なぜエラーの分布に関心があるのですか?なぜさまざまなエラー分布が役立つのですか?

2
正規リンク関数にはどのような有用なプロパティがありますか?
そこで、ここでは一般化線形モデルを研究しています。私はこの質問が非常に単純で単純であることを知っていますが、なぜリンク正準関数がそれほど有用であるのか正確にはわかりません。誰かがこの問題について直感を教えてくれませんか?

2
重みとオフセットは、ポアソン回帰で同様の結果をもたらすことができますか?
では、「一般化線形モデルにA実施者のガイド」のパラグラフ1.83でそれがことが述べられています。 「ポアソン乗法GLMの特定のケースでは、エクスポージャーの対数に等しいオフセット項を使用してクレームカウントをモデリングすると、以前の重みが各観測のエクスポージャーと等しくなるように設定されたクレーム頻度のモデリングと同じ結果が生成されたことが示されます。 」 私はこの結果についてこれ以上の参考文献を見つけることができなかったので、ステートメントが正しいことの証拠を見つけることができなかったいくつかの経験的テストを行いました。この結果が正しい/間違っている理由について誰かが洞察を提供できますか? 参考までに、私は次のRコードを使用して仮説をテストしました。この仮説では、上記の2つのケースで同様の結果を得ることができませんでした。 n=1000 m=10 # Generate random data X = matrix(data = rnorm(n*m)+1, ncol = m, nrow = n) intercept = 2 coefs = runif(m) offset = runif(n) ## DGP: exp of Intercept + linear combination X variables + log(offset) mu = exp(intercept + X%*%coefs + log(offset)) …


3
残差逸脱度と自由度を使用してロジスティック回帰モデルをテストする
私はPrinceton.eduでこのページを読んでいました。彼らはロジスティック回帰を実行しています(Rを使用)。ある時点で、モデルの自由度と等しい自由度の分布で得られたものよりも高い残差を得る確率を計算します。ウェブサイトからコピーして貼り付けています...χ2χ2\chi^2 > glm( cbind(using,notUsing) ~ age + hiEduc + noMore, family=binomial) Call: glm(formula = cbind(using, notUsing) ~ age + hiEduc + noMore, family = binomial) Coefficients: (Intercept) age25-29 age30-39 age40-49 hiEduc noMore -1.9662 0.3894 0.9086 1.1892 0.3250 0.8330 Degrees of Freedom: 15 Total (i.e. Null); 10 Residual Null Deviance: 165.8 …

2
Rはこの二項回帰のp値をどのように計算しますか?
次の二項回帰を考えます。 # Create some data set.seed(10) n <- 500 x <- runif(n,0,100) y <- x + rnorm(n,sd=100) < 0 # Fit a binomial regression model model <- glm(y ~ x, family="binomial") summary(model) summary関数は、p値を返します1.03e-05。をanova.glm使用する場合、p値の計算にどの方法を使用するかに関係なく、p値が少し極端になります。 anova(model, test="Rao") # p.value = 7.5e-6 anova(model, test="LRT") # p.value = 6.3e-6 anova(model, test="Chisq") # p.value = …

1
分散=とベータ回帰と準GLMの違いは何である
まず、背景を説明しましょう。最後に質問をまとめます。 その平均値によってパラメータベータ分布、及びφは、持っているヴァー(Y )= V (μ )/(φ + 1 )、V (μ )= μ (1 - μは)分散関数です。μμ\muϕϕ\phiVar(Y)=V(μ)/(ϕ+1)Var⁡(Y)=V⁡(μ)/(ϕ+1)\operatorname{Var}(Y) = \operatorname{V}(\mu)/(\phi+1)V(μ)=μ(1−μ)V⁡(μ)=μ(1−μ)\operatorname{V}(\mu) = \mu(1-\mu) ベータ回帰(例えば、Rにbetaregパッケージを使用)において、回帰は、ベータ分布の誤差を想定し、固定効果との値を推定。ϕϕ\phi GLM回帰では、の分散機能と「準」分布を定義することが可能である。したがって、ここでのモデルは、ベータと同じ分散関数を持つエラーを想定しています。次に、回帰は固定効果と準分布の「分散」を推定します。μ(1−μ)μ(1−μ)\mu(1-\mu) 重要なものが欠けているかもしれませんが、これらの2つの方法は本質的に同じで、おそらく推定方法が異なるだけのようです。 Iは間隔である「類似性」と呼ばれるDV、上退縮、Rの両方の方法を試みた:(0,1)(0,1)(0,1) Call: betareg(formula = Similarity ~ N + NK + Step_ent, data = TapData, link = "logit") Coefficients (mean model with logit link): Estimate Std. Error z value …

3
ワイブルファミリーにフィットするGLM [終了]
閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。 この質問を改善してみませんか? 質問を更新することがありますので、話題のクロス検証済みのため。 12か月前に閉鎖。 ワイブルファミリーの一般化線形モデルを近似しようとしていますが、Rでそれを試すと、エラーが発生します。ワイブルが指数関数的ファミリーに適合しないことは知っていますが、GLMをワイブルファミリーに適合させることに関するいくつかの研究記事を読んだことがあります。誰かがこれを手伝ってくれるなら、本当に感謝しています。次のエラーが発生します。 > data(lung) > glm(time ~ age+sex+ph.ecog+ wt.loss, family = weibull(link='log'), data = lung) Error in glm(time ~ age + sex + ph.ecog + wt.loss, family = weibull(link = "log"), : could not find function "weibull"

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.