タグ付けされた質問 「glmm」

一般化線形混合(効果)モデルは、通常、非独立の非正規データ(たとえば、縦方向のバイナリデータ)のモデリングに使用されます。

3
ランダム効果が重要かどうかをテストするにはどうすればよいですか?
ランダム効果をいつ使用するか、いつ使用する必要がないかを理解しようとしています。私が経験した4つ以上のグループ/個人がいる場合は経験則だと言われました(15の個々のムース)。これらのムースのいくつかは、合計29回の試行で2回または3回実験されました。リスクの高い地域にいるときとそうでないときで行動が異なるかどうかを知りたい。だから、私は個人をランダム効果として設定すると思いました。しかし、私は今、彼らの反応に多くの変化がないので、個人を変量効果として含める必要はないと言われています。私が理解できないのは、個人をランダム効果として設定するときに、実際に何らかの原因があるかどうかをテストする方法です。たぶん最初の質問は:Individualが適切な説明変数であり、固定効果であるべきかどうかを判断するために、どのテスト/診断を行うことができますか-qqプロット?ヒストグラム?散布図?そして、私はそれらのパターンで何を探すでしょう。 ランダムな効果として個人なしでモデルを実行しましたが、http://glmm.wikidot.com/faqで次のように述べています: lmerモデルを対応するlm近似またはglmer / glmと比較しないでください。対数尤度は釣り合っていない(つまり、異なる加算項が含まれている) そして、ここでは、これは、ランダム効果のあるモデルとないモデルの比較ができないことを意味します。しかし、とにかくそれらを比較する必要があるか本当に知りません。 ランダム効果のモデルでは、出力を見て、REがどのような証拠または重要性を持っているかを確認しようとしました lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

3
一般化線形モデルと一般化線形混合モデルの違い
混合GLMと非混合GLMの違いは何ですか?たとえば、SPSSでは、ユーザーがドロップダウンメニューを使用して次のいずれかに適合できます。 analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear 欠損値の扱いは異なりますか? 私の従属変数はバイナリであり、いくつかのカテゴリ変数および連続独立変数があります。

2
一般化線形(混合)モデル(特に残差)の診断
現在、困難なカウントデータ(従属変数)に適したモデルを見つけるのに苦労しています。lmerand などのさまざまな異なるモデル(混合効果モデルが私の種類のデータに必要です)lme4や、Gaussianや負の二項分布などのさまざまなファミリを持つ一般化線形混合効果モデルを試しました。 しかし、結果の適合をどのように正しく診断するかについてはかなり確信が持てません。Webでそのトピックについて多くの異なる意見を見つけました。線形(混合)回帰の診断は非常に簡単だと思います。先に進んで残差(正規性)を分析し、残差と比較した近似値をプロットすることで不均一分散性を調べることができます。 ただし、一般化バージョンではどのように適切に行うのですか?今のところ、負の二項(混合)回帰に注目しましょう。私はここで残差に関するまったく反対の声明を見ました: では一般化線形モデルにおける正規の残差チェック、それはプレーンな残差が正常にGLMために配布されていないことを最初の回答で指摘されているが、これは明らかだと思います。ただし、ピアソンおよび逸脱残差も正常であるとは想定されていないことが指摘されています。それでも、2番目の答えは、逸脱の残差を正規に分布する必要があることを示しています(参照と組み合わせて)。 ただし、逸脱残差を正規分布で分布させる必要があることは、?glm.diag.plots(Rのbootパッケージから)のドキュメントで示唆されています。 で、このブログの記事、著者は最初のNB混合効果回帰モデルのためのピアソン残差は、私が想定し何の正常性を研究しています。予想通り(私の意見では)、残差は正常であるとは示されず、著者はこのモデルが不適切であると仮定しました。ただし、コメントで述べたように、残差は負の二項分布に従って分布する必要があります。私の意見では、GLM残差は通常の分布とは異なる分布を持つ可能性があるため、これは真実に最も近くなります。これは正しいです?ここで異分散のようなものをチェックする方法は? 最後の点(推定分布の変位値に対する残差のプロット)は、Ben&Yohai(2004)で強調されています。現在、これは私のために行く方法のようです。 簡単に言うと、特に残差に焦点を当てて、一般化線形(混合)回帰モデルのモデル適合をどのように適切に研究しますか?

2
データに多少のばらつきがあるにもかかわらず、混合モデルでランダム効果の分散がゼロになるのはなぜですか?
次の構文を使用して、混合効果ロジスティック回帰を実行しました。 # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) 件名と項目はランダムな効果です。対象の項の係数と標準偏差が両方ともゼロであるという奇妙な結果が得られています。 Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: GoalEncoding ~ 1 + Group + (1 | Subject) …

2
yes-noカウントではなくパーセンテージに二項GLMM(glmer)を適用する方法は?
従属変数がパーセンテージである反復測定実験があり、独立変数として複数の要因があります。このセットアップに直接対応していると思われるためglmer、Rパッケージから使用してlme4(を指定してfamily=binomial)ロジスティック回帰問題として扱いたいと思います。 私のデータは次のようになります。 > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 6 1 chrmpeak-tpor1d nr075 1 …

4
lme4(> 1.0)に適合した二項GLMMの適合を評価する方法は?
私は二項分布とロジットリンク関数を備えたGLMMを所有しており、データの重要な側面がモデルで十分に表現されていないように感じています。 これをテストするために、データがロジットスケールの線形関数で適切に記述されているかどうかを知りたいと思います。したがって、残差が適切に動作するかどうかを知りたいです。ただし、どの残差プロットでプロットするか、プロットをどのように解釈するかはわかりません。 新しいバージョンのlme4(GitHubの開発バージョン)を使用していることに注意してください。 packageVersion("lme4") ## [1] ‘1.1.0’ 私の質問は次のとおりです。ロジットリンク関数を使用して、二項一般化線形混合モデルの残差を検査および解釈するにはどうすればよいですか。 次のデータは、実際のデータの17%しか表していませんが、フィッティングは既に私のマシンで約30秒かかるため、次のようにします。 require(lme4) options(contrasts=c('contr.sum', 'contr.poly')) dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif") dat$V1 <- factor(dat$V1) m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial) 最も単純なプロット(?plot.merMod)は以下を生成します。 plot(m1) これはすでに何か教えてくれますか?

1
glmerの収束警告の意味
R glmerのlme4パッケージの関数を使用しており、bobyqaオプティマイザーを使用しています(つまり、私の場合のデフォルト)。私は警告を受けており、それが何を意味するのか興味があります。 Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to reduce q 「信頼領域のステップでqを減らすことができませんでした」を検索しました。「説明のためにパウエルに相談してください」と言ったminqaパッケージで情報を見つけました。私はやりました(もし望むなら、あなたもできます!以下への参照とリンクを見てください)が、理解できません。実際、qを減らすことに関して何も見つけることができませんでした。 MJDパウエル(2007)「派生物のない制約のない最小化のためのNEWUOAの開発」、ケンブリッジ大学、応用数学および理論物理学、数値解析グループ、レポートNA2007 / 05、http: //www.damtp.cam.ac.uk/ ユーザー/ NA / NA_papers / NA2007_05.pdf。 MJDパウエル(2009)、「デリバティブを使用しないバインド制約付き最適化のためのBOBYQAアルゴリズム」、レポート番号DAMTP 2009 / NA06、英国ケンブリッジ大学数学科学センター http://www.damtp.cam.ac.uk/user/na/NA_papers/NA2009_06.pdf。 Psオプティマイザーを変更できることはわかっているので、警告やエラーなしで出力を取得できるかどうかを確認します。Ben Bolkerのコメント/回答に従って、可能な場合は勾配とヘッセ行列もチェックします。私はfrom glmer内で使用しています。ベンの答えが追加の調整なしで機能するかどうかはわかりませんが、コンピューターがそれを行っていることを完了したら、それで作業します、とにかく、私は脱線します。dredgeMuMIn 更新 以下のBolker博士のコメントに従って、私はFORTRANコードを調べ始めました(これは、ダウンロードするのではなく、見ることに興味がある人のためのコードです)コードのbobyqb.f部分に「430」が表示されます。「430」または「Qを減らす」を検索して、関連するコードを見つけます。 これはFORTRANコードとの最初の出会いですが、次の条件が満たされた場合に警告が生成されるとコードに書かれていると思います:NTRITS> …

1
応答変数が0〜1の混合モデルを適合させる方法は?
私はlme4::glmer()、バイナリではなく、0と1の間の連続変数である従属変数を使用して、二項一般化混合モデル(GLMM)を近似しようとしています。この変数は確率と考えることができます。実際、それは人間の被験者によって報告された確率です(私は分析に役立つ実験で)。すなわち、それはだない「離散」割合が、連続変数。 私のglmer()予想通りの呼び出しは(下記参照)は動作しません。どうして?私に何ができる? 後で編集:以下の私の答えは、この質問の元のバージョンよりも一般的であるため、質問もより一般的なものに変更しました。 詳細 明らかに、バイナリDVだけでなく、0と1の間の連続DVにもロジスティック回帰を使用することが可能です。確かに、私が走るとき glm(reportedProbability ~ a + b + c, myData, family="binomial") 警告メッセージが表示されます Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! しかし、非常に合理的な適合(すべての要因はカテゴリであるため、モデル予測が被験者間平均に近いかどうか、およびそれらが近いかどうかを簡単に確認できます)。 ただし、実際に使用したいのは glmer(reportedProbability ~ a + b + c + (1 | subject), myData, family="binomial") それは私に同一の警告を与え、モデルを返しますが、このモデルは明らかに非常にオフです。固定効果の推定値は、glm()対象平均値と対象平均値から非常に離れています。(そしてglmerControl(optimizer="bobyqa")、glmer呼び出しに含める必要があります。そうしないと、まったく収束しません。)

1
1つの観測値のみのランダム効果は、一般化線形混合モデルにどのように影響しますか?
ランダム効果として使用したい変数がいくつかのレベルで単一の観測値を持つデータセットがあります。以前の質問への回答に基づいて、原則としてこれで問題ないことをまとめました。 混合モデルを、観測値が1つだけの被験者に適合させることはできますか? ランダム切片モデル-被験者ごとに1つの測定 ただし、2番目のリンクでは、最初の答えは次のとおりです。 「...一般的な線形混合モデルGLMMを使用していないと仮定します。この場合、過剰分散の問題が発生します」 GLMMの使用を検討していますが、1回の観測でのランダムな効果レベルがモデルにどのように影響するかを本当に理解していません。 ここに、私が当てはめようとしているモデルの1つの例を示します。私は鳥を研究していますが、移動中のストップの数に対する人口と季節の影響をモデル化したいと思います。一部の個人では最大5年間のデータがあるため、個人をランダム効果として使用したいと思います。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", "NU", …

1
変量効果ロジスティック回帰のICCの計算
次の形式でロジスティック回帰モデルを実行しています。 lmer(response~1+(1|site), family=binomial, REML = FALSE) 通常、切片と残差からICCを計算しますが、モデルの要約には残差は含まれません。これをどのように計算しますか?

1
オフセットを伴うポアソンランダム効果モデルの過剰分散とモデリングの代替
被験者内実験を使用した実験研究からのカウントデータをモデル化する際に、多くの実際的な質問に遭遇しました。実験、データ、およびこれまでに行ったことを簡単に説明した後、質問をします。 回答者のサンプルに対して、4つの異なる映画が順番に表示されました。各映画の後にインタビューが行われ、RQ(予測カウント変数)に関係する特定のステートメントの出現回数をカウントしました。また、発生する可能性のある最大数(コーディング単位、オフセット変数)も記録しました。さらに、映画のいくつかの特徴が連続的な尺度で測定され、そのうちの1つは、映画の特徴がステートメントの数に与える影響の因果仮説があり、他は制御(予測)です。 これまでに採用されたモデリング戦略は次のとおりです。 因果変数を共変量として使用し、他の変数を制御共変量として使用するランダム効果ポアソンモデルを推定します。このモデルには、 'log(units)'(コーディング単位)に等しいオフセットがあります。ランダム効果は被験者全体で取得されます(映画固有のカウントは被験者にネストされます)。因果仮説が確認されました(因果変数の係数)。推定では、Rのlme4パッケージ、特に関数glmerを使用しました。 今、私は次の質問をしています。ポアソン回帰の一般的な問題は、過剰分散です。これは、負の二項回帰を使用し、その分散パラメーターが単純なポアソンモデルのモデルフィットを改善するかどうかを評価することでテストできることを知っています。ただし、ランダム効果のコンテキストでこれを行う方法はわかりません。 自分の状況で過分散をテストするにはどうすればよいですか?適合方法を知っている単純なポアソン/負の二項回帰(ランダム効果なし)で過分散をテストしました。テストでは、過剰分散の存在が示唆されています。ただし、これらのモデルではクラスタリングが考慮されていないため、このテストは正しくないと思われます。また、過分散のテストに対するオフセットの役割についてもわかりません。 負の二項ランダム効果回帰モデルのようなものがあり、それをRにどのように適合させる必要がありますか? データを試してみるべき代替モデルの提案がありますか?つまり、反復測定構造、カウント変数、および露出(コーディング単位)を考慮に入れていますか?

2
Rのlmer()でポアソンGLMMの過分散をテストする方法は?
私は次のモデルを持っています: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ...そしてこれは要約出力です。 > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) …

1
マージナルモデルと変量効果モデル–どちらを選択するか?素人へのアドバイス
周辺モデルと変量効果モデル、およびそれらの間の選択方法に関する情報を検索すると、いくつかの情報が見つかりましたが、それは多かれ少なかれ数学的な抽象的な説明でした(例:https://stats.stackexchange .com / a / 68753/38080)。どこかで、これら2つのメソッド/モデル(http://www.biomedcentral.com/1471-2288/2/15/)の間のパラメーター推定値の間に実質的な違いが観察されたことがわかりましたが、その反対はZuur et alによって書かれました。(2009、p。116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6)。マージナルモデル(一般化推定方程式アプローチ)は母集団平均パラメーターをもたらしますが、ランダム効果モデル(一般化線形混合モデル)からの出力はランダム効果を考慮します–主題(Verbeke et al。2010、pp。49–52; http:/ /link.springer.com/chapter/10.1007/0-387-28980-1_16)。 非統計学者や非数学者に馴染みのある言語で、いくつかのモデル(実生活)の例に示されているこれらのモデルの素人のような説明を見せてください。 詳しく知りたいのですが: 周辺モデルを使用する必要がある場合と、変量効果モデルを使用する必要がある場合 これらのモデルはどの科学的質問に適していますか? これらのモデルからの出力はどのように解釈されるべきですか?

2
一般化線形混合モデル:診断
ランダムな切片ロジスティック回帰(繰り返し測定による)があり、特に外れ値と影響力のある観測に関して、いくつかの診断を行いたいと思います。 残差を見て、目立つ観測があるかどうかを確認しました。しかし、クックの距離やDFFITSのようなものも見てみたいと思います。HosmerとLemeshow(2000)は、相関データのモデル診断ツールがないため、相関を無視して通常のロジスティック回帰モデルに適合させ、通常のロジスティック回帰に使用できる診断ツールを使用する必要があると述べています。彼らは、これは診断をまったく行わないよりもましだと主張している。 この本は2000年のもので、混合効果ロジスティック回帰によるモデル診断に現在利用できる方法はあるのでしょうか。外れ値をチェックするための良いアプローチは何でしょうか? 編集(2013年11月5日): 応答がないため、混合モデルで診断を行うことが一般的に行われていないのか、それともデータのモデリング時に重要なステップではないのかと思います。だから私の質問を言い換えましょう:「良い」回帰モデルを見つけたらどうしますか?

1
回帰モデルで「ネストされた」変数をどのように処理しますか?
変数と変数responseについて条件付きで記述したい変数があり、ネストされた変数が説明変数の特定の値の意味のある変数としてのみ発生する統計的な問題について考えます。説明変数が意味のあるネストされた変数を許可しない場合、後者は通常、データセットのようにコーディングされるか、値でコーディングされている場合、その値は意味のある解釈のない単なるプレースホルダーです。explanatorynestedNA この状況は、モノの存在を示す説明変数と、そのモノの特性を説明する1つ以上のネストされた変数がある場合に必ず発生します。統計的な問題におけるこの種の状況のいくつかの例は次のとおりです。 説明変数は、調査の参加者がであるかどうかの指標でmarriedあり、ネストされた変数は一部ですcharacteristic of the spouse(例:教育、年齢など)。 説明変数はpresence of an itemスペース内ののインジケーターであり、ネストされた変数はいくつかのcharacteristic of the itemサイズ(たとえば、サイズ、距離など)です。 説明変数はの発生のインジケーターでeventあり、ネストされた変数はいくつかの説明ですcharacteristic of the event(たとえば、期間、大きさなど)。 このような状況では、応答変数と他の変数との関係を記述する回帰型モデル(GLM、GLMMなどを含む広い意味で)を構築することがよくあります。このタイプのモデルでネストされた変数の処理方法は明らかではありません。 質問:nestedこのタイプのモデルで変数をどのように処理しますか? 注:この質問は、回帰のネストされた変数に関するCV.SEで繰り返し発生する質問に対する一般化された回答を提供することを目的としています(たとえば、ここ、ここ、ここ、およびここを参照)。この質問は、この問題の一般化されたコンテキストに依存しない例を示すことを目的としています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.