タグ付けされた質問 「dglm」

2
ガンマ分布でGLMにRを使用する
現在、ガンマ分布を使用してGLMを近似するためのRの構文を理解するのに問題があります。 データのセットがあり、各行には3つの共変量()、応答変数(Y)、および形状パラメーター(K)が含まれています。ガンマ分布のスケールを3つの共変量の線形関数としてモデル化したいのですが、データの各行に対して分布の形状をKに設定する方法がわかりません。X1,X2,X3X1,X2,X3X_1, X_2, X_3YYYKKKKKK 私が似ていると思う状況は、二項分布の場合、GLMでは各データエントリについて試行回数()がわかっている必要があるということです。NNN

2
異分散性で線形回帰をシミュレーションする
私が持っている経験的データと一致するデータセットをシミュレートしようとしていますが、元のデータのエラーを推定する方法がわかりません。経験的データには不等分散性が含まれていますが、私はそれを変換することに興味はありません。むしろ、経験的データのシミュレーションを再現するために誤差項をもつ線形モデルを使用します。 たとえば、いくつかの経験的データセットとモデルがあるとします。 n=rep(1:100,2) a=0 b = 1 sigma2 = n^1.3 eps = rnorm(n,mean=0,sd=sqrt(sigma2)) y=a+b*n + eps mod <- lm(y ~ n) 使用plot(n,y)すると、次のようになります。 ただし、データをシミュレートしようとするsimulate(mod)と、異分散性は削除され、モデルによってキャプチャされません。 一般化された最小二乗モデルを使用できます VMat <- varFixed(~n) mod2 = gls(y ~ n, weights = VMat) AICに基づいてより適切なモデルフィットを提供しますが、出力を使用してデータをシミュレートする方法がわかりません。 私の質問は、元の経験的データ(上記のnおよびy)に一致するようにデータをシミュレートできるモデルをどのように作成するかです。具体的には、いずれかのモデルを使用して、エラーであるsigma2を推定する方法が必要ですか?

1
二項応答に対する異分散一般化線形モデルのあてはめ
次の実験計画のデータがあります。私の観察はK、対応する試行数()のうち成功した数()の数であり、各個人からN構成される2つのグループに対して測定されたI、T処理からの、そのような各因子の組み合わせにR反復がある。したがって、全体で2 * I * T * R Kと対応するNがあります。 データは生物学からのものです。それぞれの個体は、2つの代替形態(代替スプライシングと呼ばれる現象による)の発現レベルを測定する遺伝子です。したがって、Kは1つの形式の発現レベルであり、Nは2つの形式の発現レベルの合計です。単一の表現されたコピーにおける2つの形式間の選択は、ベルヌーイ実験であると想定されるため、NのうちKコピーは二項式に従います。各グループは約20の異なる遺伝子で構成され、各グループの遺伝子は2つのグループ間で異なるいくつかの共通の機能を持っています。各グループの各遺伝子について、3つの異なる組織(処理)のそれぞれから約30の測定値があります。グループと治療がK / Nの分散に与える影響を推定したいと思います。 遺伝子発現は過剰に分散していることがわかっているため、以下のコードでは負の二項式を使用しています。 たとえば、Rシミュレートされたデータのコード: library(MASS) set.seed(1) I = 20 # individuals in each group G = 2 # groups T = 3 # treatments R = 30 # replicates of each individual, in each group, in each treatment groups = letters[1:G] …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.