統計とビッグデータ bugs

4

ベイジアンモデルを推定するためのBUGSスタイルの環境を試しています。OpenBugsまたはJAGSを選択する際に考慮すべき重要な利点はありますか？近い将来、一方が他方を置き換える可能性はありますか？ Rで選択したGibbs Samplerを使用します。特定のアプリケーションはまだありませんが、どちらを導入して学習するかを決定しています。

41 r software bugs jags gibbs

1

BUGSとRのパラメーター化はどの分布で異なりますか？

BUGSとRのパラメーター化が異なる正規分布、対数正規分布、ワイブル分布を見つけました。これらのそれぞれについて、Rが使用する2番目のパラメーターは、BUGS（または私の場合はJAGS）で使用する前に逆変換（1 /パラメーター）する必要があることを収集します。現在存在するこれらの変換の包括的なリストを知っている人はいますか？私が見つけることができる最も近いものは、JAGS 2.2.0ユーザーマニュアルの表7の分布を、?rnorm等の結果と、おそらくいくつかの確率テキストと比較することです。このアプローチでは、変換をPDFから個別に推定する必要があるようです。このタスク（および起こりうるエラー）が既に行われている場合は回避するか、ここからリストを開始します。更新 Benの提案に基づいて、パラメーターのデータフレームをRからBUGSパラメーター化に変換する次の関数を作成しました。 ##' convert R parameterizations to BUGS paramaterizations ##' ##' R and BUGS have different parameterizations for some distributions. ##' This function transforms the distributions from R defaults to BUGS ##' defaults. BUGS is an implementation of the BUGS language, and these …

31 r distributions bugs jags parameterization

5

機械学習で階層/ネストされたデータを処理する方法

例で問題を説明します。いくつかの属性（年齢、性別、国、地域、都市）を与えられた個人の収入を予測するとします。あなたはそのようなトレーニングデータセットを持っています train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

縦カウントデータの分析方法：GLMMでの時間的自己相関の説明

統計の達人とRプログラミングウィザードの皆さん、私は、動物の捕獲物を環境条件とその日の関数としてモデリングすることに興味があります。別の研究の一環として、私は3年間で約160日間のキャプチャのカウントを持っています。これらの各日には、気温、降雨、風速、相対湿度などがあります。データは同じ5つのプロットから繰り返し収集されたため、プロットをランダム効果として使用します。私の理解では、nlmeは残差の時間的自己相関を簡単に説明できますが、lme4（自己相関を処理できない？）のような非ガウスリンク関数を処理しません。現在、log（count）でRのnlmeパッケージを使用するとうまくいくと思います。だから今の私の解決策は次のようなものを実行することです： m1 <- lme(lcount ~ AirT + I(AirT^2) + RainAmt24 + I(RainAmt24^2) + RHpct + windspeed + sin(2*pi/360*DOY) + cos(2*pi/360*DOY), random = ~1|plot, correlation = corARMA(p = 1, q = 1, form = ~DOY|plot), data = Data) ここで、DOYは年間通算日です。最終モデルにはより多くの相互作用があるかもしれませんが、これは私の一般的な考えです。また、分散構造を次のようなものでさらにモデル化することもできます。 weights = v1Pow ポアソン混合モデル回帰または何かを処理するより良い方法があるかどうかはわかりませんか？KedemとFokianosによる「時系列分析の回帰モデル」の第4章で数学的な議論を見つけました。現時点では、特にアプリケーション（Rでコーディング）で私を少し超えていました。また、ZuurらでMCMCソリューションを見ました。（winBUGSまたはJAGを使用して）BUGS言語のMixed Effects Modelsブック（Chp 23）。それが私の最善の選択肢ですか？これを処理する簡単なMCMCパッケージがRにありますか？私はGAMMやGEEの手法にあまり詳しくありませんが、人々がより良い洞察を提供してくれると思ったら、これらの可能性を喜んで探ります。私の主な目的は、与えられた環境条件で動物の捕獲を予測するモデルを作成することです。第二に、私は動物がその活動の観点からどのような反応をするかを説明したいと思います。（哲学的に）進むための最良の方法、Rでこれをコーディングする方法、またはBUGSでコーディングする方法についての考えをいただければ幸いです。私はRとBUGS（winBUGS）にはかなり慣れていませんが、学んでいます。これは、時間的自己相関に対処することを試みた最初の例でもあります。ありがとう、ダン

16 r mixed-model autocorrelation bugs panel-data

2

ベイジアン分析に最適なソフトウェアパッケージ

ベイジアン推論を実行するために、どのソフトウェア統計パッケージをお勧めしますか？たとえば、openBUGSまたはwinBUGSをスタンドアロンとして実行したり、Rから呼び出すこともできます。しかし、Rにはベイジアン分析を実行できる独自のパッケージ（MCMCPack、BACCO）がいくつかあります。 Rのどのベイジアン統計パッケージが最適であるか、または他の選択肢（MatlabまたはMathematica？）についての提案はありますか？比較したい主な機能は、パフォーマンス、使いやすさ、安定性、柔軟性です

14 r probability bayesian inference bugs

5

Rバグの代替のみ[終了]

閉まっている。この質問はトピック外です。現在、回答を受け付けていません。この質問を改善したいですか？質問を更新して、相互検証のトピックになるようにします。 11か月前に閉鎖されました。私はBUGSとRを使用してベイジアン統計のコースをフォローしています。今、私はすでにBUGSを知っています。それは素晴らしいですが、Rだけでなく別のプログラムを使用することはあまり好きではありません。 Rには多くの新しいベイジアンパッケージがあることを読みました。ベイジアン統計用のパッケージとその機能に関するリストまたはリファレンスはありますか？そして、バグの柔軟性のためのRパッケージの代替手段はありますか？

13 r bayesian bugs

1

隠れマルコフモデルで「最適な」モデルを選択するための基準

データの潜在状態の数を推定するために、隠れマルコフモデル（HMM）を近似しようとする時系列データセットがあります。これを行うための私の擬似コードは次のとおりです。 for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } さて、通常の回帰モデルでは、BICは最もpar約的なモデルを好む傾向がありますが、HMMの場合、それが何をしているのかわかりません。BIC基準がどのようなHMMの傾向があるのかを実際に知っている人はいますか？また、AICと尤度値も取得できます。州の真の総数を推測しようとしているので、これらの基準の1つは、この目的のために他の基準よりも「優れている」のでしょうか。

12 r aic hidden-markov-model bic spss manova time-series r lme4-nlme regression modeling negative-binomial bayesian bugs state-space-models hypothesis-testing data-transformation factor-analysis sem

2

BUGS / JAGSのようなプログラムはどのようにしてギブスサンプリングの条件付き分布を自動的に決定しますか？

多くの場合、完全な条件文は導出するのが非常に難しいようですが、JAGSやBUGSのようなプログラムはそれらを自動的に導出します。誰かが任意のモデル仕様の完全な条件をアルゴリズム的に生成する方法を説明できますか？

11 bayesian conditional-probability jags bugs gibbs

3

バグ、JAGSの加重一般化回帰

では、weightsパラメータを使用しRてglm回帰を「事前に重み付け」できます。例えば： glm.D93 <- glm(counts ~ outcome + treatment, family = poisson(), weights=w) JAGSまたはBUGSモデルでこれをどのように達成できますか？これについて議論している論文を見つけましたが、どれも例を示していません。私は主にポアソンとロジスティック回帰の例に興味があります。

10 bayesian generalized-linear-model jags bugs weighted-regression

2

BUGS / JAGS / STANでプロポーションをモデリングするにはどうすればよいですか？

私は、応答が比例であるモデルを構築しようとしています（これは、実際に党が選挙区で獲得する投票のシェアです）。その分布は正規ではないため、ベータ分布でモデル化することにしました。私はいくつかの予測因子も持っています。しかし、私はそれをBUGS / JAGS / STANで書く方法がわかりません（JAGSが私の最良の選択でしょうが、それは本当に重要ではありません）。私の問題は、予測子によってパラメーターの合計を作成することですが、それを使って何ができるでしょうかコードは（JAG構文では）このようなものにy_hatなりyますが、およびパラメーターを「リンク」する方法がわかりません。 for (i in 1:n) { y[i] ~ dbeta(alpha, beta) y_hat[i] <- a + b * x[i] } （y_hatは、パラメーターと予測子のクロス積であり、したがって決定論的な関係です。aそしてb、私xが予測しようとする係数であり、予測子です）。あなたの提案をありがとう！

10 bayesian jags bugs beta-regression stan

4

Rの離散時間イベント履歴（生存）モデル

Rに離散時間モデルを適合させようとしていますが、その方法がわかりません。従属変数を時間監視ごとに1つずつ異なる行に編成し、glm関数をlogitまたはcloglogリンクで使用できることを読みました。この意味で、私は3つの列があります：ID、Event（各time-obsで1または0）およびTime Elapsed（観測の開始以降）、および他の共変量。モデルに合うようにコードを書くにはどうすればよいですか？従属変数はどれですか？Event従属変数として使用できTime Elapsed、共変量に含めることができると思います。しかし、どうなりIDますか？必要ですか？ありがとう。

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

3

Winbugsおよびその他のMCMC（事前配布の情報なし）

パラメータの分布がわからない場合はどうなりますか？どのアプローチを使用する必要がありますか？ほとんどの場合、特定の変数が特定の種の存在/不在に何らかの影響を及ぼし、その変数が変数の重要度に従って受け入れられるかどうかについては、十分に検討することを目指しています。これは、ほとんどの場合、パラメーターが持つはずの推定分布については考えていません。 b1、b2、b3およびb4が-2と2の間で変化し、b0が-5と5の間で変化する可能性があることを私が知っているすべてのパラメーターが正規分布に従うと仮定することは正しいですか？ model { # N observations for (i in 1:N) { species[i] ~ dbern(p[i]) logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + b3*var3[i] + b4*var4[i] } # Priors b0 ~ dnorm(0,10) b1 ~ dnorm(0,10) b2 ~ dnorm(0,10) b3 ~ dnorm(0,10) b4 ~ dnorm(0,10) }

10 r bayesian mcmc bugs winbugs

1

WinBUGSで特定の変数の予測を取得する方法は？

私はWinBUGSの新しいユーザーであり、あなたの助けに1つの質問があります。次のコードを実行した後、私はのパラメータを持っbeta0てbeta4（統計情報、密度）が、私は最後の値の予測を取得する方法がわからないh私がするように設定、NAコード内でモデル化することを。誰かが私にヒントを与えることができますか？何かアドバイスをいただければ幸いです。 model { for(i in 1: N) { CF01[i] ~ dnorm(0, 20) CF02[i] ~ dnorm(0, 1) h[i] ~ dpois (lambda [i]) log(lambda [i]) <- beta0 + beta1*CF03[i] + beta2*CF02[i] + beta3*CF01[i] + beta4*IND[i] } beta0 ~ dnorm(0.0, 1.0E-6) beta1 ~ dnorm(0.0, 1.0E-6) beta2 ~ dnorm(0.0, 1.0E-6) beta3 ~ dnorm(0.0, …

10 bayesian bugs prediction winbugs

1

JAGSの応答変数の欠損値

Gelman＆Hill（2006）のコメント： Bugsでは、回帰で欠落した結果は、データベクトル、NAなどを含めるだけで簡単に処理できます。バグは明示的に結果変数をモデル化するため、このモデルを使用して、実際には各反復で欠損値を補完するのは簡単です。これは、JAGSを使用して予測を行う簡単な方法のように思えます。しかし、結果が欠落している観測は、パラメーター推定にも影響しますか？もしそうなら、これらの観測をJAGSが見るデータセットに保持する簡単な方法はありますか？私はカット機能について考えていましたが、それはJAGSではなくBUGSでのみ利用可能です。

10 missing-data bugs jags

2

mcmc.listからplot.bugsおよびplot.jagsによって生成されるプロットと同様のプロットをどのように生成できますか？[閉まっている]

閉まっている。この質問はトピックから外れています。現在、回答を受け付けていません。この質問を改善してみませんか？質問を更新することがありますので、話題のクロス検証済みのため。 2年前休業。 Rは、関数R2WinBUGS :: bugsとR2jags：jagsによって生成されたオブジェクトbugsとjagsオブジェクトから素晴らしい要約プロットを出力できるようです。しかし、私はrjagsパッケージを使用しています。結果をrjags::coda.samples使用R2WinBUGS::plot.mcmc.listして関数の結果をプロットしようとすると、各パラメーターの診断プロット（パラメーター密度、チェーン時系列、自己相関）になります。以下は、Andrew Gelmanのチュートリアル「RからのWinBuugsとOpenBugsの実行」から作成したいプロットのタイプです。これらはを使用して作成されましたplot.pugs。問題はplot.bugs、bugsオブジェクトを引数としてplot.mcmc.list受け取り、の出力を受け取ることですcoda.samples。次に例を示します（からcoda.samples）： library(rjags) data(LINE) LINE$recompile() LINE.out <- coda.samples(LINE, c("alpha","beta","sigma"), n.iter=1000) plot(LINE.out) 私が必要なのはによって生成されたものと同様の、情報が豊富な、1ページの要約プロットを生成する方法 plot.bugs LINE.outバグオブジェクトに変換する関数または

9 r data-visualization jags bugs

タグ付けされた質問 「bugs」

タグ付けされた質問「bugs」