タグ付けされた質問 「weibull」

1
自由度は非整数の数値にできますか?
GAMを使用すると、残留DFは(コードの最終行)になります。どういう意味ですか?GAMの例を超えて、一般に、自由度の数を整数以外の数にすることはできますか?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees of freedom Residual Deviance: 177.4662 on 26.6 degrees of …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

4
ワイブル分布のEM最尤推定
注: 私は、技術的な理由で自分で投稿できない元学生の質問を投稿しています。 pdfを持つワイブル分布からの iidサンプル与えられた場合、 は有用な欠損変数表現 、したがって、直接的な方法を使用する代わりにのMLEを見つけるために使用できる関連EM(期待値最大化)アルゴリズム数値最適化?バツ1、… 、xnバツ1、…、バツnx_1,\ldots,x_nfk(x )= k xk − 1e− xkx > 0fk(バツ)=kバツk−1e−バツkバツ>0 f_k(x) = k x^{k-1} e^{-x^k} \quad x>0 fk(x )= ∫Zgk(x 、z)d zfk(バツ)=∫Zgk(バツ、z)dzf_k(x) = \int_\mathcal{Z} g_k(x,z)\,\text{d}zkkk



1
GBMパッケージとGBMを使用したキャレット
私はを使用してモデルのチューニングを行ってきましたがcaret、gbmパッケージを使用してモデルを再実行しています。caretパッケージが使用gbmし、出力が同じである必要があることは私の理解です。ただし、を使用した簡単なテスト実行でdata(iris)は、評価指標としてRMSEとR ^ 2を使用したモデルで約5%の不一致が示されています。を使用して最適なモデルのパフォーマンスを見つけたいが、部分的な依存関係プロットを利用するためにcaret再実行しgbmます。再現性のために以下のコード。 私の質問は次のとおりです。 1)これらの2つのパッケージは同じであっても違いがあるのはなぜですか(確率的ですが、5%がやや大きな違いであることがわかります。特に、次のような素晴らしいデータセットを使用していない場合 iris、モデリングの) 。 2)両方のパッケージを使用する利点または欠点はありますか? 3)無関係:irisデータセットを使用した場合、最適な値interaction.depthは5ですが、読み取り値が最大値floor(sqrt(ncol(iris)))である2 を超えるはずです。これは厳密な経験則ですか、それとも非常に柔軟ですか。 library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric <- "RMSE" trainControl <- trainControl(method="cv", number=10) set.seed(99) gbm.caret <- train(Sepal.Length ~ ., data=iris, distribution="gaussian", method="gbm", trControl=trainControl, verbose=FALSE, tuneGrid=caretGrid, metric=metric, bag.fraction=0.75) …

4
歪んだ非通常のデータでZスコアを使用できますか?[閉まっている]
閉じた。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善したいですか?詳細を追加し、この投稿を編集して問題を明確にします。 5年前に閉鎖されました。 私はいくつかのプロセスサイクルタイムデータを処理し、フルサイクルタイムの各部分を比較するために、標準のZスコアを使用してスケーリングしています。 データが非常に右に歪んでいる/非正常であるため、他の変換を使用する必要がありますか?(「外れ値」は決して負の時間をとることができず、「平均」よりもはるかに長くかかることがよくあります) Zスコアを使用しても「機能する」ようです... ############### # R code ############### mydata <- rweibull(1000,1,1.5) hist(mydata) hist(scale(mydata))


1
ワイブル対ガンマ分布
ライン上の連続するポイント間の距離を含むデータ(1Dベクトル)があります。 伝統的に私の分野では、このようなデータは、ポイントの分布を説明するためにガンマ分布で適合されますが、場合によっては、ワイブル分布がよりよく適合する(BIC / AICに基づくとより高い可能性)または場合によっては、ワイブルが任意の有意性に適合する唯一の分布です。私はワイブル分布に過度に精通していません-これは私のデータサンプルについて何を明らかにしているでしょうか?ガンマとは対照的に、ワイブルでよりよく表される、より短い距離またはより長い距離への特定のスキューはありますか?ここで適用できるガンマとワイブルの主な違いは何ですか?

1
ワイブル分布のMLE推定のアプローチの比較
いくつかのデータに対してワイブル分布をパラメーター化する必要があります。したがって、Rのfitdistrplusパッケージからの最尤推定(MLE)を使用します。ただし、パッケージで何が行われるかを理解したかったので、パッケージを使用するほかに、 fitdist。 要約すると、私のアプローチは次のとおりです。 (i)メソッド「MLE」でfitdist関数を使用します。 (ii)尤度関数の偏導関数を解く (iii)optim関数を使用して負の尤度を最小化 まず、いくつかのデータをシミュレートします。 n <- 1e4 set.seed(1) dat <- rweibull(n, shape=0.8, scale=1.2) アプローチ1: fitdistrplusパッケージを適用します。 library(fitdistrplus) A1 <- fitdist(dat, "weibull", method="mle")$estimate A1 shape scale 0.7914886 1.2032989 アプローチ2: ワイブル密度として 、 偏微分は次のとおりです。 上記の偏微分の根を検索します。 weib1 <- function(c) { 1/c - sum(dat^c*log(dat))/sum(dat^c) + 1/n*sum(log(dat)) } shape <- uniroot(weib1, c(0,10), tol=1e-12)$root scale …

3
Rの時変共変量を使用したワイブル生存モデル
私はワイブルアプローチを使用して生存モデルを実行しようとしていますが、しわがあるのは、時変共変量があるためです。私はRでサバイバルパッケージを使用しています。私の呼び出しは次のとおりです。 output <- survreg(Surv(start, stop, fail) ~ gdppc + [...] + cluster(name), data = mydata, dist="weibull") 次のエラーが発生します。 Error in survreg(Surv(start, stop, fail) ~ gdppclag + : Invalid survival type coxph手順が正常に動作しますが、私はワイブルを使用します。 私の最初の質問は次のとおりです。ワイブルアプローチは、時変共変量を説明できますか?私はいくつかのテキストを見回しましたが、Cox PHアプローチは時変共変量に拡張できることがわかりました。ワイブルアプローチがそれを実行できるかどうかはあまり明確ではありません。 次に、実際にワイブルが機能する場合、それを処理できるRのパッケージは何ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.