yes-noカウントではなくパーセンテージに二項GLMM(glmer)を適用する方法は?


21

従属変数がパーセンテージである反復測定実験があり、独立変数として複数の要因があります。このセットアップに直接対応していると思われるためglmer、Rパッケージから使用してlme4(を指定してfamily=binomial)ロジスティック回帰問題として扱いたいと思います。

私のデータは次のようになります。

 > head(data.xvsy)
   foldnum      featureset noisered pooldur dpoolmode       auc
 1       0         mfcc-ms      nr0       1      mean 0.6760438
 2       1         mfcc-ms      nr0       1      mean 0.6739482
 3       0    melspec-maxp    nr075       1       max 0.8141421
 4       1    melspec-maxp    nr075       1       max 0.7822994
 5       0 chrmpeak-tpor1d    nr075       1       max 0.6547476
 6       1 chrmpeak-tpor1d    nr075       1       max 0.6699825

そして、これが適切だと思っていたRコマンドです:

 glmer(auc~1+featureset*noisered*pooldur*dpoolmode+(1|foldnum), data.xvsy, family=binomial)

これに関する問題は、コマンドが従属変数が整数ではないことについて文句を言うことです:

In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!

そして、この(パイロット)データの分析は結果として奇妙な答えを与えます。

binomial家族が整数(はい、いいえ)を期待する理由を理解していますが、パーセンテージデータを直接回帰しても問題ないようです。これを行う方法?


1
10個中5個は1000個中500個と同じ情報ではないため、私には問題ないようです。応答をnoの1つのカウントとして表現してください。「成功」と1つのカウント。「失敗」。
Scortchi -復活モニカ

@Scortchiありがとう、あなたは正しいと思う。私は、確率の決定から導出されたパーセンテージの連続的な性質について、stats.stackexchange.com / questions / 77376 / と同様に考えていましたが、整数カウントへの意味のある変換によってデータを表現できると思います。
ダンStowell

回答:


22

で応答変数として比率のベクトルを使用するにglmer(., family = binomial)は、weights引数を使用して各比率に至る試行回数を設定する必要があります。たとえばcbpplme4パッケージのデータを使用する場合:

glmer(incidence / size ~ period + (1 | herd), weights = size,
   family = binomial, data = cbpp)

試行の総数がわからない場合は、エラーメッセージに示されているように、二項モデルは適切ではありません。


これに重みを使用するかどうかは言えません。ただし、式の左側に2列の行列(成功/失敗)としてデータを入力できます。
ndoogan 14

@ndoogan、元の質問は成功/失敗ではなく、割合に関するものでした。また、上記のコードは、cbppヘルプページから引用したとおりに機能します。
スティーブウォーカー14

けっこうだ。とはいえ、私は成功/失敗(除算を意図したものではない)を意味するつもりでしたが、二項モデルの比率はどこから来るのでしょうか。
ndoogan 14

+1ですが、読者は過分散に対処するための可能な方法について@BenBolkerの答えをここstats.stackexchange.com/questions/189115で見たいかもしれません。
アメーバは、モニカを復活させる

9

(0,1)


2
二項モデルは、比率のモデルです。ただし、試行回数がわかっている場合にのみ適切です。あなたが持っているすべてが試行回数の兆候のないパーセントである場合、私はあなたがベータ回帰が適切であることは正しいと信じています。
ndoogan 14

(0,1)

おかげで、これは良い点です。質問に書かれている通りに答えるので、私は他の答えを受け入れますが、ベータ回帰についてのポイントはよく作られているので、それを支持しました。
ダンStowell 14
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.