タグ付けされた質問 「tweedie-distribution」

1
非負のゼロ膨張連続データをモデル化する方法は?
私は現在、線形モデル(family = gaussian)を生物多様性の指標に適用しようとしています。生物多様性はゼロ未満の値を取ることはできず、ゼロで膨張し、連続しています。値の範囲は0から0.25強です。その結果、モデルの残差には明らかなパターンがありますが、私はそれを取り除くことができませんでした。 誰もこれを解決する方法についてアイデアを持っていますか?

3
ゼロで凝集する非負データのモデル(Tweedie GLM、ゼロで膨張したGLMなど)は正確なゼロを予測できますか?
Tweedie分布は、パラメーター(平均分散関係の指数)が1〜2の場合、点質量がゼロの歪んだデータをモデル化できます。ppp 同様に、ゼロで膨らんだ(そうでなければ連続的または離散的)モデルは、多数のゼロを持つ場合があります。 これらの種類のモデルを使用して予測または近似値を計算すると、予測値がすべてゼロ以外になるのはなぜなのか理解できません。 これらのモデルは実際に正確なゼロを予測できますか? 例えば library(tweedie) library(statmod) # generate data y <- rtweedie( 100, xi=1.3, mu=1, phi=1) # xi=p x <- y+rnorm( length(y), 0, 0.2) # estimate p out <- tweedie.profile( y~1, p.vec=seq(1.1, 1.9, length=9)) # fit glm fit <- glm( y ~ x, family=tweedie(var.power=out$p.max, link.power=0)) # predict pred <- …

2
エラー分布のファミリとしてポアソン、ガンマ、またはトゥイーディー分布を使用して、Python / scikit-learnでGLMを評価することは可能ですか?
いくつかのPythonとSklearnを学習しようとしていますが、私の仕事では、ポアソン、ガンマ、特にTweedieファミリの誤差分布を使用する回帰を実行する必要があります。 それらについてのドキュメントには何も見当たらないが、それらはRディストリビューションのいくつかの部分にあるので、誰かがPythonのどこかで実装を見たのではないかと思っていた。あなたがTweedieディストリビューションのSGD実装に向けて私を向けることができれば、それはさらに格好良いでしょう!


1
Tweedieを使用するGLMが与えられた場合、どのようにして係数を見つけるのですか?
しましょう YYY パラメータのTweedie分布に従う確率変数である α = 1.1α=1.1\alpha = 1.1。リンク関数を自然対数とします。フォームの数のデータベースがあると仮定します (y1、バツ1 、1、バツ1 、2、。。。、バツ1 、m)(y1,x1,1,x1,2,...,x1,m)(y_1, x_{1,1}, x_{1,2}, ..., x_{1,m}) (y2、バツ2 、1、バツ2 、2、。。。、バツ2 、m)(y2,x2,1,x2,2,...,x2,m)(y_2, x_{2,1}, x_{2,2}, ..., x_{2,m}) ... (yん、バツn 、1、バツn 、2、。。。、バツn 、m)(yn,xn,1,xn,2,...,xn,m)(y_n, x_{n, 1}, x_{n, 2}, ..., x_{n, m})。 変数は、カテゴリー変数と連続変数の混合です。これはGLMであるため、 E[ Y] =eバツβE[Y]=eXβE[Y] = e^{X\beta}。だからここに私の質問があります:数値のデータベースを与えられ、これが特定のパラメーターを持つトゥイーディー分布であるという事実を使用して、どのアルゴリズムを使用して最良の選択をするかββ\beta?最小化する必要があるエラー関数はありますか、または最尤のパラメーターを推定しますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.