Rでbetareg関数を使用して混合モデルを実装する方法は?


12

私は、個々のオタマジャクシの「活動レベル」を測定する比率で構成されるデータセットを持っているため、値は0と1の間でバインドされます。このデータは、特定の時間間隔(移動の場合は1動きがない場合は0)、平均して個人ごとに1つの値を作成します。私の主な固定効果は「密度レベル」でしょう。

私が直面している問題は、変量効果として含めたい因子変数「池」があることです。池の違いは気にしませんが、統計的に考慮します。池に関する重要な点の1つは、池が3つしかないことです。ランダムな効果を処理するときは、より多くの因子レベル(5+)を持つことが理想的であることを理解しています。

可能であれば、Rを使用して、betareg()またはbetamix()Rで混合モデルを実装する方法についてアドバイスをお願いします。Rのヘルプファイルを読んだことがあるのですが、通常、それらを理解するのは難しいと感じます(各引数パラメーターが実際に意味するところ)私自身のデータと、生態学的な意味での出力値の意味)ので、例を介してよりよく働く傾向があります。

関連するノートでは、代わりにglm()二項ファミリーの下でロジットリンクを使用して、この種のデータで変量効果を説明できるかどうか疑問に思っていました。


いいえ、glm()でエラー条件を組み込むことはできません。ロジットは応答を変換し、線形混合モデルを検討しますか?
utobi 2016年

@utobiありがとうございます、これをやってみます。それで、あなたは3つのレベルだけでランダムな効果を持っている心配はありませんか?
Kat Y

変数「池」の意味はわかりませんが、繰り返し測定を行っている場合、変量効果はほぼ必須です。測定を繰り返していない場合は、ここでランダムと固定のどちらがオープンかという議論になります。3つのレベルの変量効果で問題はない可能性があります。原則として、それらの分散は推定可能です。あなたの分野の文献をチェックすることをお勧めします。ランダム効果と固定効果について説明している素晴らしい本はstat.columbia.edu/~gelman/armです。
utobi 2016年

1
@utobiアドバイスありがとうございます。参考になりました。その本を見てみよう!私はロジット変換をしてしまい、lmer()を使いました。
Kat Y

この回答をチェックしてくださいstats.stackexchange.com/questions/167340/...
ディオゴB Provete

回答:


11

の現在の機能にbetaregは、ランダム/混合効果は含まれていません。ではbetareg()、あなただけあなたの3レベルの池変数の固定効果、例えば、含めることができます。このbetamix()関数は、混合効果ベータ回帰ではなく、有限混合ベータ回帰を実装します。

あなたの場合、最初に、固定池係数効果がどのような効果をもたらすかを確認しようとします。これにより2つの自由度が "犠牲"になりますが、ランダムな効果は1つの追加の自由度でわずかに安くなります。しかし、2つのアプローチが非常に異なる質的な洞察につながるとしたら、私は驚くでしょう。

最後に、glm()はベータ回帰をサポートしていませんが、mgcvパッケージには関数betar()で使用できるファミリがありgam()ます。


ご意見ありがとうございます。betareg関数のいくつかの側面を明確にしました。この時点で、私は@utobiのアドバイスを取り入れ、ロジット変換を行ったので、lmer()を使用できます。次のデータセットも0と1の間にバインドされているため、gam()を調べます。変換によって分布を正規化することはできません:)
Kat Y

1
アプローチが同様の結果を返すことを期待しますが、何かを学ぶことができるいくつかの違いも。したがって、3つすべてを試してみることをお勧めします。つまり、betareg固定効果、lmerランダム効果でロジット変換、およびを使用gambetarます。(また、答えが役に立った場合は、賛成または賛成を検討してください。)
Achim Zeileis

15

パッケージglmmTMBは、同様の質問を持つすべての人に役立つ場合があります。たとえば、ランダムな効果として上記の質問の池を含めたい場合は、次のコードでうまくいきます。

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

CVへようこそ。ご協力いただき、ありがとうございます。これは答えというよりはむしろコメントです。あなたの答えを拡張できますか?
フェルディ

遅れてすみません、コメントはすぐには表示されませんでした。お役に立てば幸いです。
Kori K

3

これはコメントとして始まりましたが、長くかかりました。ここでは、変量効果モデルは適切ではないと思います。池は3つしかありません-3つの数値から分散を推定しますか?これは、変量効果モデルで何が起こっているかです。池は研究者にとって便利な理由で選ばれたのではなく、「アメリカ大陸の池」のランダムなサンプルとして選ばれたのではないかと思います。

変量効果モデルの利点は、池間変動を考慮した応答(活動レベル)の信頼区間を作成できることです。固定効果モデル-言い換えると、池をブロックのように扱う-は、池効果の応答を調整します。いくつかの追加の治療効果(各池に2種類のカエルなど)があった場合、ブロッキングにより平均二乗誤差(Fテストの分母)が減少し、治療の効果が明らかになります。

この例では、処理効果がなく、池の数が変量効果モデルには少なすぎる(そしておそらく「非無作為」である)ため、この研究からどのような結論を導き出すことができるかわかりません。池の間の違いの良い見積もりを得ることができますが、それはそれについてです。他の池の環境では、カエルのより広い個体群に推論が引き寄せられているのを見ていません。私はそれをパイロット研究として組み立てることができると思います。

ここでランダム効果モデルを使用すると、池の分散の推定値が非常に信頼性が低くなるため、注意して使用する必要があることに注意してください。

しかし、元の質問については、これはレートの問題ではありませんか?単位時間あたりのイベントの主な分布はポアソン分布です。したがって、時間間隔をオフセットとしてカウントを使用して、ポアソン回帰を行うことができます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.