タグ付けされた質問 「log-linear」

5
回帰を理解する-モデルの役割
パラメータを取得しようとしている関数がわからない場合、回帰モデルはどのように使用できますか? 私は、子供を母乳で育てた母親は、後の人生で糖尿病を患う可能性が低いと言った研究を見ました。この研究は約1000人の母親の調査から得られたもので、さまざまな要因が管理されており、対数線形モデルが使用されました。 これは、糖尿病の可能性を決定するすべての要因を考慮して、ログを持つ線形モデルにきちんと変換される素敵な機能(おそらく指数関数的)と、女性の母乳が統計的に有意であることが判明したことを意味しますか? 私は確かに何かを見逃していますが、彼らはどのようにモデルを知っていますか?


3
3レベルの分割表を処理する適切な方法
いくつかの種、それらが収集された宿主植物、およびその収集が雨の日に起こったかどうか(これは実際に重要です!)のカウントデータを含む3レベルの分割表があります。Rを使用すると、偽のデータは次のようになります。 count <- rpois(8, 10) species <- rep(c("a", "b"), 4) host <- rep(c("c","c", "d", "d"), 2) rain <- c(rep(0,4), rep(1,4)) my.table <- xtabs(count ~ host + species + rain) , , rain = 0 species host a b c 12 15 d 10 13 , , rain = 1 species …

4
ログ線形モデル
誰かがなぜログ線形モデルを非常に素人の言葉で使用するのか説明できますか?私は工学系の出身ですが、これは私にとって難しい問題であることが判明しています。それは統計です。ご返信をお待ちしております。

1
二項応答に対する異分散一般化線形モデルのあてはめ
次の実験計画のデータがあります。私の観察はK、対応する試行数()のうち成功した数()の数であり、各個人からN構成される2つのグループに対して測定されたI、T処理からの、そのような各因子の組み合わせにR反復がある。したがって、全体で2 * I * T * R Kと対応するNがあります。 データは生物学からのものです。それぞれの個体は、2つの代替形態(代替スプライシングと呼ばれる現象による)の発現レベルを測定する遺伝子です。したがって、Kは1つの形式の発現レベルであり、Nは2つの形式の発現レベルの合計です。単一の表現されたコピーにおける2つの形式間の選択は、ベルヌーイ実験であると想定されるため、NのうちKコピーは二項式に従います。各グループは約20の異なる遺伝子で構成され、各グループの遺伝子は2つのグループ間で異なるいくつかの共通の機能を持っています。各グループの各遺伝子について、3つの異なる組織(処理)のそれぞれから約30の測定値があります。グループと治療がK / Nの分散に与える影響を推定したいと思います。 遺伝子発現は過剰に分散していることがわかっているため、以下のコードでは負の二項式を使用しています。 たとえば、Rシミュレートされたデータのコード: library(MASS) set.seed(1) I = 20 # individuals in each group G = 2 # groups T = 3 # treatments R = 30 # replicates of each individual, in each group, in each treatment groups = letters[1:G] …

1
カテゴリカルデータのペナルティ付き方法:因子のレベルを組み合わせる
ペナルティモデルは、パラメーターの数がサンプルサイズ以上のモデルを推定するために使用できます。この状況は、カテゴリデータまたはカウントデータの大きなスパーステーブルの対数線形モデルで発生する可能性があります。これらの設定では、他の因子との相互作用の観点からそれらのレベルが区別できない因子のレベルを組み合わせることにより、テーブルを折りたたむことが望ましいまたは役立つこともよくあります。2つの質問: LASSOやエラスティックネットなどのペナルティモデルを使用して、各要素内のレベルの折りたたみ性をテストする方法はありますか? 最初の質問に対する答えが「はい」の場合、レベルの崩壊とモデル係数の推定が1つのステップで発生するように設定できますか?

1
ポアソン/対数線形モデルの尤度比検定のためにゼロカウントを調整する必要がありますか?
分割表に0がありglm、尤度比検定用にネストされたポアソン/対数線形モデル(R 関数を使用)を近似している場合、glmモデルを近似する前にデータを調整する必要があります(たとえば、すべてに1/2を追加します)カウント)?明らかに、いくつかのパラメータは調整なしでは推定できませんが、調整/調整の欠如はLRテストにどのように影響しますか?

1
すべての対数線形モデルには、完全に同等のロジスティック回帰がありますか?
対数線形モデルを調査データの多数の変数に適合させようとしています。代わりにロジスティック回帰をそのデータに当てはめることが望ましい場合があるいくつかの理由があります。いくつかの当局は、これらは同等であると示唆しています。しかし、私はこれを疑ういくつかの理由があります。 対数線形モデルはすべての変数を同等に扱いますが、ロジスティック回帰では1つの変数を応答変数として識別する必要があります。 最小二乗のコンテキストでは、Y = a + bX +ε対X = c + dY +εの場合、パラメーターdが約1 / bに等しいことは一般的ではありません。これは、最初の方程式が垂直誤差を最小限に抑え、2番目の方程式が水平誤差を最小限に抑えるためです。これらは、推定された線の周りで誤差が対称である場合にのみ等しくなります。そのため、これがロジスティック回帰にも当てはまるのではないかと心配しています。(2)は、実際には(1)の特定の形式にすぎません。つまり、特定の変数を応答として選択することにより、回帰形式で非対称になる可能性があります。 対数線形モデルのすべての変数が1つ以上の交互作用項に含まれている場合、ロジスティック回帰がどのように等価になるかはわかりません。応答変数がロジスティック回帰のコンテキストに含まれる相互作用をどのように表現しますか? Bill Huberに応えて、私はWikipediaよりもかなり制限された意味で対数線形モデルという用語を使用しています。テーブルに配置されたカテゴリーまたは順序カウントデータのモデルを参照します。係数はテーブルカウントの合計、各因子のマージナルカウントをテーブルカウントの合計(確率のプロキシとして機能)で割った値、およびさまざまな交互作用項です。これは、とりわけ、Agrestiで使用されている「カテゴリデータ分析」の意味です。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.