次の一般化線形モデルがあります。オブジェクトglmDV
は、試行全体に対する成功の割合としてモデル化されます。オブジェクトx_i
は連続変数です。
これは数学表記ではどのように見えますか?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
次の一般化線形モデルがあります。オブジェクトglmDV
は、試行全体に対する成功の割合としてモデル化されます。オブジェクトx_i
は連続変数です。
これは数学表記ではどのように見えますか?
winp.glm = glm(glmDV ~ x1 + x2 + x3 + x4 + x5 + x6 + x7,
data=myData, family=binomial("logit"))
回答:
ここで、および。logit-1(x)=exp(x)
これに関するより徹底的で非常に親しみやすい説明は、Agrestiの「カテゴリーデータ分析の概要」にあります。
しかし、あなたの特定の質問に対して、あなたは成功の割合をモデル化していると述べています。これは、実際には二項GLMを使用するものではありません。しかし、あなたが本当に望んでいるのは、二項GLMが行うことであり、Rでも可能です。それは、あなたがしていることを少し調整するだけで済みます。試行回数が有限で、成功する可能性がある場合でも、密度を持つ同じモデルを使用できます。 値は実験計画法によって固定され、は観測された成功であるため、パラメーターで推論を実行していますY ∈ { 0 ... N } のPr (Y )〜( NNYθ
Rに関しては、単純にglmDV
2列の行列であるオブジェクトを作成します。最初の列は成功の数、2番目の列は失敗の総数です。ステートメントの残りの部分は同じままです!n − y
glm
私の知る限り、2列ではなく1列の応答変数のみを受け入れます。私が間違っている場合は訂正し、可能であれば関連ドキュメントを引用してください。ありがとうございました!
glm
ドキュメントの「詳細」の最初の段落。R関数がどのように機能するかを学ぶ良い方法は、Googleに関数名を教えることです。これは通常、関連するドキュメントを表示します。?glm
Rコンソールに入力することもできます
0
sと1
sのセット(説明に基づいて収集したもの)ではなく比率である場合は、weights
引数w / ?glmを使用する必要があります。ここで、重みは総試行回数です。各観測について。