タグ付けされた質問 「generalized-linear-model」

「リンク関数」を介して非線形関係を可能にし、応答の分散を予測値に依存させることができる線形回帰の一般化。(通常の線形モデルを一般的な共分散構造と多変量応答に拡張する「一般線形モデル」と混同しないでください。)

3
ベルヌーイ、二項、およびポアソン以外のGLMに関する教科書?
編集:初心者向けの一般化線形モデルに関する最良の本は何ですか?私の質問には答えません。一つには、私はその質問への回答で述べられているすべての本を本質的に持っています。彼らはこの資料をカバーしていません。質問で特に強調する必要がある部分を太字にしています。これらの「初心者向け」の教科書は、私が探しているトピックをカバーしていません。 私が線形モデルまたは一般化線形モデルで見たすべての教科書は、通常のベルヌーイ、二項、およびポアソンGLM(一般化線形モデル)をカバーしています。 私が読んだ他のタイプのGLMの背後にある理論をカバーするテキストを探しています。たとえば、通常、逆ガウス、ガンマです(そして、誰かからTweedie GLMについて聞いたことがあると思います。 tを覚えている)。 この教材が教科書でカバーされている場所を誰かが知っていますか?

2
GLM標準エラー
GLMモデルの係数の標準誤差を取得する方法について質問があります。手作業で計算したフィッシャー情報マトリックスを持っていますが、スケーリングされていません。GLM関数から同じ標準エラーを取得できるように、フィッシャー情報マトリックスをどのようにスケーリングできますか?

1
Tweedieを使用するGLMが与えられた場合、どのようにして係数を見つけるのですか?
しましょう YYY パラメータのTweedie分布に従う確率変数である α = 1.1α=1.1\alpha = 1.1。リンク関数を自然対数とします。フォームの数のデータベースがあると仮定します (y1、バツ1 、1、バツ1 、2、。。。、バツ1 、m)(y1,x1,1,x1,2,...,x1,m)(y_1, x_{1,1}, x_{1,2}, ..., x_{1,m}) (y2、バツ2 、1、バツ2 、2、。。。、バツ2 、m)(y2,x2,1,x2,2,...,x2,m)(y_2, x_{2,1}, x_{2,2}, ..., x_{2,m}) ... (yん、バツn 、1、バツn 、2、。。。、バツn 、m)(yn,xn,1,xn,2,...,xn,m)(y_n, x_{n, 1}, x_{n, 2}, ..., x_{n, m})。 変数は、カテゴリー変数と連続変数の混合です。これはGLMであるため、 E[ Y] =eバツβE[Y]=eXβE[Y] = e^{X\beta}。だからここに私の質問があります:数値のデータベースを与えられ、これが特定のパラメーターを持つトゥイーディー分布であるという事実を使用して、どのアルゴリズムを使用して最良の選択をするかββ\beta?最小化する必要があるエラー関数はありますか、または最尤のパラメーターを推定しますか?

1
2つの多項分布の比較
背景:ピザを8つのスライスに切ったところを想像してみてください。 [ スライスの各直線エッジに、反対の極性を外側に向けた磁石を挿入します。これらのコンポーネントを分離して、ひっくり返さないようにして振ると、完全なピザになります。 ここで、追加のスライス(同じサイズ、フルピザの1/8)を入れても、フルピザが常に形成されるとは限りません。4&5、3&6、2&7および1&8のクラスターを形成できます。 モデル(Hosokawa et al。(1994)により提供)は、各クラスターが形成される確率を示します。モデルを検証するために、いくつかの物理実験を行います。実験条件ごとに20回試行しています。 私の結果は次のようになります: Cluster Theoretical Physical 3,6: 6.01961132827 4 1,8: 2.77455224377 5 4,5: 6.62198848501 5 2,7: 4.58384794294 6 上記のデータは多項分布です(ダイスを振ったときに得られる分布に似ています)。9つのスライスがある場合、各試行は4つの状態のいずれかで終了できます。 9スライスの実験に加えて、40スライス(およびその他いくつか)の実験のデータも持っています。(ここに含めたい場合はお知らせください) 問題:適合度をテストするために、ピアソンのカイ2乗検定を実行します。ただし、両方の分布の平均は「近い」ため、帰無仮説を棄却できません。ただし、帰無仮説も受け入れられません。 質問:モデルが物理実験にどの程度「近づく」かを示すより良い方法はありますか?「標準偏差」に相当する多項式、またはおそらく信頼区間?信頼区間のある回帰? 更新:私の同僚は、Rでの回帰分析のために次のアプローチを提案しました: d=read.csv("data.csv") length(unique(d$abs_state)) nrow(d) d$n_componentsf=as.factor(d$n_components) ncomps=9 dsubs=d[d$n_components==ncomps,] # using exact multinomial test in EMT (better) library(EMT) # using Chi square test statistics EMT::multinomial.test(dsubs$freq_obs, …

1
完全(グローバル)回帰モデルに基づく推論は適切ですか?
完全なモデルに基づく推論は適切であり、適切な場合はどのような状況ですか? 応答変数といくつかの候補予測子変数の間の潜在的な関係に関心があり、何らかの形の回帰(たとえば、一般化線形モデル)を使用してそれに答えるとします。どの予測因子が「重要」であるか、または応答と明らかに真の関係にあるかを推測する1つのアプローチは、情報理論的基準(たとえばAIC)に基づくモデル比較です。最終モデルで保持されない変数は応答とある程度の関係があるかもしれませんが、モデルに保持されている他の予測子を考えると、それらは本質的に追加の実質的な情報を提供しません。 完全な(グローバル)モデル(すべての候補予測子を含む)を単純に当てはめて、そこで停止し、t統計(または他の統計)とp値のみに基づいて個々の予測子に基づいて推論する方が適切な場合はありますかこの完全なモデルでは、さらにモデルを選択する必要はありませんか? 私は、潜在的な欠点はあるものの、これを行うのが賢明なことかもしれないという提案に遭遇しました(例:Whittingham et al。「なぜなぜ生態学と行動に段階的モデリングを使用するのですか?」(2006)。偏りはありませんが、モデルの他の(「重要でない」)変数がそれらに影響を与える可能性があるため、他のソースはこれらの推定値とp値は信頼できないと述べています。 潜在的な生物学的関係を理解することを目的とする場合、どの方法がより適切でしょうか?

1
ロジスティック回帰の適合値と確率
従属変数 [0,1]の範囲の依存値があります。意味0と1、およびその間のすべての値が含まれます。したがって、これはたとえば農家が受精させる土地の割合などの比例値です。 型番 私が現在注力しているモデルは、ロジスティックモデルです。 ただし、出力として、モデルによって従属変数がどのように予測されるかを確認したいと思います(実際の値と推定値を比較するため)。 ただし、ロジスティック回帰は通常、出力として「確率」を示します。その結果、私は今少し混乱しています。 私のモデル= out <- glm(cbind(fertilized, total_land-fertilized) ~ X-variables, family=binomial(cloglog), data=Alldata) 私が使用する受精地の推定割合を予測するには Alldata$estimated_fertilized<-predict(out,data=newdata,type="response")) これは正しいです?または、この線は予測されたパーセンテージの代わりに確率を与えますか?正しくない場合、必要なものを取得するにはどうすればよいですか? 更新 選択したモデルの正確性について質問があるという事実を踏まえて、いくつかの追加情報を提供します。 従属変数の分布(これは0-1、0、1を含む比率です)。


1
ロジスティック回帰仮説が確率関数と見なされるのはなぜですか?
ロジスティック回帰仮説が確率関数と見なされるのはなぜですか? 0または1を予測するためにそれを使用することを理解していますが、それでも、0と1の間の数値を出力する関数(仮説)が確率関数と見なされるのはなぜですか? これはヒューリスティックですか?


3
GLMは「パラメーターで線形」でなければなりません
「パラメータの線形」が何を意味するのかについて、いくつかの認知的不協和音が発生しています。たとえば、こことここ。 たとえば、私の理解は yi=β0+β1β2x1+exp(β3)(x2)2+ϵyi=β0+β1β2x1+exp⁡(β3)(x2)2+ϵy_i = \beta_0 + \beta_1\beta_2x_1 + \exp(\beta_3)(x_2)^2 + \epsilon 2つのパラメーター変数が一緒に乗算されているため(つまり、 β1,β2β1,β2{\beta_1, \beta_2})。 もし β1β1\beta_1 (言う)に置き換えられました γ1γ1\gamma_1、定数です。 誰かがこの点を明確にできるかどうか感謝します。

2
RおよびStataソフトウェアでの重力モデルの計算:係数が同じで標準誤差が異なるのはなぜですか?
RおよびStataソフトウェアで重力モデルの計算を実行しました。 計算にはglmm、R(パラメーター付きfamily = quasipoisson)とppmlStata の標準パッケージを使用しました。 Rで計算手順を呼び出します。 summary(glmm<-glm(formula=exports ~ ln_GDPimporter + ln_GDPexporter + ln_GDPimppc + ln_GDPexppc + ln_Distance + ln_Tariff + ln_ExchangeRate + Contig + Comlang + Colony_CIS + EAEU_CIS + EU_European_Union, family=quasipoisson(link="log"),data=data_pua)) Rの結果は次のとおりです。 同じデータについて、ppml手順を使用して、スタタで計算を実行しました。 ppml exports ln_gdpimporter ln_gdpexporter ln_gdpimppc ln_gdpexppc ln_distance ln_tariff ln_exchangerate contig comlang colony_cis eaeu_cis eu_european_union スタタでの計算結果は次のとおりです。 ご覧のとおり、モデル係数(結果表の2列目)は、少なくとも小数点以下4桁目まで同じです。 …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.