タグ付けされた質問 「generalized-linear-model」

「リンク関数」を介して非線形関係を可能にし、応答の分散を予測値に依存させることができる線形回帰の一般化。(通常の線形モデルを一般的な共分散構造と多変量応答に拡張する「一般線形モデル」と混同しないでください。)



4
LASSOモデルに反復再加重最小二乗法(IRLS)を適用する方法は?
IRLSアルゴリズムを使用してロジスティック回帰をプログラムしました。適切な機能を自動的に選択するために、LASSOペナルティを適用したいと思います。各反復で、以下が解決されます。 (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} してみましょうλλ\lambda非負実数であること。The Elementsで提案されているように、インターセプトにペナルティを課していません。統計学習。すでにゼロの係数についても同様です。そうでなければ、右側から項を引きます: XT(y−p)−λ×sign(β^)XT(y−p)−λ×sign(β^)\mathbf{X^T\left(y-p\right)-\lambda\times \mathrm{sign}\left(\hat\beta\right)} ただし、IRLSアルゴリズムの変更については不明です。それは正しい方法ですか? 編集:私はそれについて自信がありませんでしたが、ここで私がついに思いついた解決策の一つです。興味深いのは、このソリューションがLASSOについて私が今理解していることに対応していることです。実際、各反復には1つではなく2つのステップがあります。 最初のステップは以前と同じです:アルゴリズムの反復を行います(上の勾配の式でように)、λ=0λ=0\lambda=0 第二のステップは、新しいものである:我々は、(成分以外の各構成要素に軟判定閾値を適用ベクトルの切片に相当)β第一工程で得られました。これは、反復ソフトしきい値アルゴリズムと呼ばれます。β0β0\beta_0ββ\beta ∀i≥1,βi←sign(βi)×max(0,|βi|−λ)∀i≥1,βi←sign(βi)×max(0,|βi|−λ)\forall i \geq 1, \beta_{i}\leftarrow\mathrm{sign}\left(\beta_{i}\right)\times\max\left(0,\,\left|\beta_{i}\right|-\lambda\right)

2
エラー分布のファミリとしてポアソン、ガンマ、またはトゥイーディー分布を使用して、Python / scikit-learnでGLMを評価することは可能ですか?
いくつかのPythonとSklearnを学習しようとしていますが、私の仕事では、ポアソン、ガンマ、特にTweedieファミリの誤差分布を使用する回帰を実行する必要があります。 それらについてのドキュメントには何も見当たらないが、それらはRディストリビューションのいくつかの部分にあるので、誰かがPythonのどこかで実装を見たのではないかと思っていた。あなたがTweedieディストリビューションのSGD実装に向けて私を向けることができれば、それはさらに格好良いでしょう!

4
ロジスティック回帰と変曲点
バイナリの結果といくつかの共変量のデータがあります。ロジスティック回帰を使用してデータをモデル化しました。単純な分析だけで、異常なことは何もありません。最終出力は、特定の共変量に対して確率がどのように変化するかを示す用量反応曲線であると想定されています。このようなもの: ロジスティック回帰を選択したことについて、(純粋な統計家ではなく)内部のレビューアからいくつかの批判を受けました。ロジスティック回帰は、確率スケールでのS字型曲線の変曲点が確率0.5であると想定(または定義)します。彼は、変曲点が確かに確率0.5であると仮定する理由はないと主張し、実際の位置がデータに基づくように変曲点を変化させることができる別の回帰モデルを選択する必要があります。 私はこの点について考えたことがないので、最初は彼の議論に油断しました。変曲点が0.5であると仮定することが正当化される理由について、私は何の議論もしませんでした。いくつかの調査を行った後、私はまだこの質問に対する答えがありません。 変曲点が追加のパラメーターである5パラメーターロジスティック回帰に出くわしましたが、この回帰モデルは通常、連続的な結果を伴う用量反応曲線を作成するときに使用されているようです。バイナリ応答変数に拡張できるかどうか、またどのように拡張できるかはわかりません。 私の主な質問は、ロジスティック回帰の変曲点が0.5であると仮定してよいのはなぜですか?それも重要ですか?ロジスティック回帰モデルをフィッティングして、変曲点の問題を明確に議論する人を見たことがありません。変曲点が必ずしも0.5とは限らない線量応答曲線を作成するための代替手段はありますか? 完全を期すために、上の図を生成するためのRコード: dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") dat$rank <- factor(dat$rank) logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat) newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4))) pp <- predict(logit, newdata, type = "response", se.fit = TRUE) …

1
ロジスティック回帰モデルの操作
次のコードが何をしているかを理解したいと思います。コードを書いた人はここではもう働かず、ほとんど完全に文書化されていません。私は「考えて誰かにそれを調査するように頼まれたことは、ベイズロジスティック回帰モデルです」 bglm <- function(Y,X) { # Y is a vector of binary responses # X is a design matrix fit <- glm.fit(X,Y, family = binomial(link = logit)) beta <- coef(fit) fs <- summary.glm(fit) M <- t(chol(fs$cov.unscaled)) betastar <- beta + M %*% rnorm(ncol(M)) p <- 1/(1 + exp(-(X %*% betastar))) …

4
この場合、ポアソン回帰には線形回帰よりもどのような利点がありますか?
ある高校の生徒が獲得した賞の数を含むデータセットが与えられました。獲得した数の予測には、学生が登録されたプログラムのタイプと数学の最終試験のスコアが含まれます。 なぜこの例では線形回帰モデルが適さないのか、そしてなぜポアソン回帰を使用する方が良いのか、誰かが教えてくれるのではないかと思いました。ありがとう。

1
最小二乗対一般化線形モデル対非線形最小二乗を使用して指数関数をフィッティング
指数関数的減衰を表すデータセットがあります。このデータに指数関数を当てはめたいと思います。応答変数をログ変換してから、最小二乗法を使用して線をフィットさせました。対数リンク関数と応答変数の周りのガンマ分布を持つ一般化線形モデルを使用します。非線形最小二乗法を使用します。2つの係数はそれぞれ類似していますが、それぞれの方法で異なる答えが得られます。私が混乱しているところは、どの方法が最適で、なぜ使用するのかわかりません。誰かがこれらの方法を比較して対比できますか?ありがとうございました。y=Beaxy=Beaxy = Be^{ax}

1
glm()関数の「開始値」とは何ですか?
パラメータはどのようなものがありstart、etastart、mustartでGLM()関数?私はドキュメントとインターネットを調べてきましたが、これが何を意味するのか明確な説明は見つかりませんでした。 これはチェーンのベイジアン「初期値」に似ていますが、Rのglm()関数は頻出統計なので、これは関連しているとは思えません...

1
GLMでの正準リンク関数の計算
正準リンク関数は、指数関数ファミリーの自然パラメーターに由来すると考えました。ファミリー 場合、は正準リンク関数です。取るベルヌーイ分布の一例として、我々は つまり、正規リンク関数g(⋅)g(⋅)g(\cdot)f(y,θ,ψ)=exp{yθ−b(θ)a(ψ)−c(y,ψ)}f(y,θ,ψ)=exp⁡{yθ−b(θ)a(ψ)−c(y,ψ)} f(y,\theta,\psi)=\exp\left\{\frac{y\theta-b(\theta)}{a(\psi)}-c(y,\psi)\right\} θ=θ(μ)θ=θ(μ)\theta=\theta(\mu)P(Y=y)=μy(1−μ)1−y=exp{ylogμ1−μ+log(1−μ)}P(Y=y)=μy(1−μ)1−y=exp⁡{ylog⁡μ1−μ+log⁡(1−μ)} P(Y=y)=\mu^{y}(1-\mu)^{1-y}=\exp\left\{y\log\frac{\mu}{1-\mu}+\log{(1-\mu)}\right\} g(μ)=logμ1−μg(μ)=log⁡μ1−μg(\mu)=\log\frac{\mu}{1-\mu} しかし、このスライドを見ると、 g '(\ mu)= \ frac {1} {V(\ mu)} であると主張して g′(μ)=1V(μ)g′(μ)=1V(μ) g'(\mu)=\frac{1}{V(\mu)} います。この特定の分布(およびポアソン分布などの他のいくつかの分布)は簡単に確認できます一般的なケースの等価性がわかりません。誰かがヒントを与えることはできますか?ありがとう〜

1
GLMパラメータの推論には自由度補正を使用する必要がありますか?
この質問は、Martijnのこちらの回答に触発されています。 二項モデルやポアソンモデルのような1つのパラメーターファミリーにGLMを当てはめ、それが(たとえば、準ポアソンとは対照的に)完全な尤度手順であると仮定します。次に、分散は平均の関数です。二項式:およびポアソン。var[X]=E[X]E[1−X]var[X]=E[X]E[1−X]\text{var}[X] = E[X]E[1-X]var[X]=E[X]var[X]=E[X]\text{var}[X] = E[X] 残差が正規分布している場合の線形回帰とは異なり、これらの係数の有限の正確なサンプリング分布は不明であり、結果と共変量のおそらく複雑な組み合わせです。また、GLMの平均の推定値を使用します。これは、結果の分散のプラグイン推定値として使用されます。 ただし、線形回帰と同様に、係数には漸近正規分布があるため、有限標本推論では、それらの標本分布を正規曲線で近似できます。 私の質問は、有限サンプル内の係数のサンプリング分布にT分布近似を使用することで何かを得られるかどうかです。一方で、我々は知っている、ブートストラップやジャックナイフ推定が適切にこれらの矛盾を説明することができるとき、T近似は間違った選択のように思えるので、分散をまだ我々は正確な分布を知りません。一方で、T分布のわずかな保守主義は、​​実際には単純に好まれます。

1
GLMにはいくつのディストリビューションがありますか?
私は、GLMが5つの分布(つまり、ガンマ、ガウス、二項、逆ガウス、およびポアソン)で記述されている教科書の複数の場所を特定しました。これは、Rの家族関数でも例示されています。 追加のディストリビューションが含まれているGLMへの参照に遭遇することがあります(例)。これらの5つがなぜ特別なのか、または常にGLMにあるのか、誰かがなぜ他の人が特別なのかを誰かが説明できますか? 私がこれまでに学んだことから、指数関数的に家族の中でGLM分布フォームにすべて適合: ここで、ϕは分散パラメーター、θは正準パラメーターです。f(y;θ,ϕ)=exp{yθ−b(θ)ϕ+c(y,ϕ)}f(y;θ,ϕ)=exp⁡{yθ−b(θ)ϕ+c(y,ϕ)}f(y;\theta,\phi)=\exp\left\{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\right\}ϕϕ\phiθθ\theta GLMに適合するように分布を変換することはできませんか?


1
完全な成功を収めたカテゴリー変数を含む2項式glmm
二項応答変数とカテゴリカル予測子を使ってglmmを実行しています。ランダムな効果は、データ収集に使用されるネストされたデザインによって与えられます。データは次のようになります。 m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 1 0 0.... > m.gen1$nest [1] 1 1 1 2 2 3 3 3 3 4 4 4 ..... Levels: 1 2 3 4 …

3
ゼロで積み重ねられた連続データを持つGLM
私は結核、エイズなどの壊滅的な病気が入院費にどれだけ影響を与えるかを推定するモデルを実行しようとしています。私は従属変数として「入院費用あたり」と独立変数としてさまざまな個々のマーカーを持っています。それらのほとんどすべてが性別、世帯主のステータス、貧困ステータスなどのダミーであり、もちろんあなたが病気(プラス年齢)を持っているかどうかのダミーですと年齢の2乗)と相互作用項の束。 予想されるように、かなりの量のデータが(つまり、大量のデータが)ゼロに蓄積されています(つまり、12か月の参照期間の入院費用はありません)。これらのようなデータを処理する最良の方法は何でしょうか? 今のln(1+cost)ところ、すべての観測を含むようにコストをに変換し、線形モデルを実行することにしました。私は正しい軌道に乗っていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.