複数の研究からの情報を組み合わせて、正規分布データの平均と分散を推定する-ベイジアンとメタ分析のアプローチ


21

私は一連の論文をレビューしました。各論文は、既知のサイズそれぞれのサンプルにおける測定値の観測平均とSDを報告しています。私が設計している新しい研究で同じ測定値の可能性のある分布について可能な限り推測し、その推測にどの程度の不確実性があるかを考えたいと思います。)と仮定してうれしいです。N X N μ σ 2バツnXNμσ2

私の最初の考えはメタ分析でしたが、モデルは通常、ポイント推定と対応する信頼区間に焦点を当てています。ただし、の完全な分布について何か言いたいことがあります。この場合、分散について推測することも含まれます。 σ 2バツσ2

私は、事前の知識に照らして、特定の分布のパラメーターの完全なセットを推定するための可能なBayeisanアプローチについて読んでいます。これは一般的に私には理にかなっていますが、ベイジアン分析の経験はゼロです。これは、歯を切るのが簡単で比較的単純な問題のようにも思えます。

1)私の問題を考えると、どのアプローチが最も理にかなっており、なぜですか?メタ分析またはベイジアンアプローチ?

2)ベイジアンアプローチが最適だと思う場合、これを実装する方法を教えていただけますか(できればRで)。

関連する質問

編集:

私は、これを「単純な」ベイジアン様式だと思う方法で解決しようとしています。

上で述べたように、私は推定された平均でなく、事前情報、すなわちを考慮した分散にも興味があります。μσ2Pμσ2|Y

繰り返しになりますが、実際のベイジアンについては何も知りませんが、平均と分散が未知の正規分布の事後分布は、正規逆ガンマ分布の共役を介した閉形式解を持っていることを見つけるのに時間がかかりませんでした。

問題はとして再定式化されます。Pμσ2|Y=Pμ|σ2YPσ2|Y

Pμ|σ2Yは正規分布で推定されます。逆ガンマ分布のPσ2|Y

それはそれのまわりで私の頭を取得するために私にしばらく時間がかかったが、これらのリンクから(12、私はR.でこれを行う方法をソートするために、私が思うに、できました)

33個のスタディ/サンプルそれぞれの行と、平均、分散、サンプルサイズの列から構成されるデータフレームから始めました。事前情報として、1行目の最初の調査の平均、分散、サンプルサイズを使用しました。次に、次の調査の情報でこれを更新し、関連するパラメーターを計算し、正規逆ガンマからサンプリングしておよび分布を取得しました。これは、33の研究すべてが含まれるまで繰り返されます。μσ2

# Loop start values values

  i <- 2
  k <- 1

# Results go here

  muL      <- list()  # mean of the estimated mean distribution
  varL     <- list()  # variance of the estimated mean distribution
  nL       <- list()  # sample size
  eVarL    <- list()  # mean of the estimated variance distribution
  distL    <- list()  # sampling 10k times from the mean and variance distributions

# Priors, taken from the study in row 1 of the data frame

  muPrior  <- bayesDf[1, 14]    # Starting mean
  nPrior   <- bayesDf[1, 10]    # Starting sample size
  varPrior <- bayesDf[1, 16]^2  # Starting variance

  for (i in 2:nrow(bayesDf)){

# "New" Data, Sufficient Statistics needed for parameter estimation

    muSamp    <- bayesDf[i, 14]          # mean
    nSamp     <- bayesDf[i, 10]          # sample size
    sumSqSamp <- bayesDf[i, 16]^2*(nSamp-1)  # sum of squares (variance * (n-1))

# Posteriors

    nPost   <- nPrior + nSamp
    muPost  <- (nPrior * muPrior + nSamp * muSamp) / (nPost)  
    sPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               ((nPrior * nSamp) / (nPost)) * ((muSamp - muPrior)^2)
    varPost <- sPost/nPost
    bPost   <- (nPrior * varPrior) + 
                sumSqSamp + 
               (nPrior * nSamp /  (nPost)) * ((muPrior - muSamp)^2)
# Update 

    muPrior   <- muPost
    nPrior    <- nPost
    varPrior  <- varPost

# Store

    muL[[i]]   <-  muPost
    varL[[i]]  <-  varPost
    nL[[i]]    <-  nPost
    eVarL[[i]] <- (bPost/2) / ((nPost/2) - 1)

# Sample

    muDistL  <- list()  
    varDistL <- list()

    for (j in 1:10000){
      varDistL[[j]] <- 1/rgamma(1, nPost/2, bPost/2)
      v             <- 1/rgamma(1, nPost/2, bPost/2)
      muDistL[[j]]  <- rnorm(1, muPost, v/nPost)
    }

# Store 

    varDist    <- do.call(rbind, varDistL)
    muDist     <- do.call(rbind, muDistL)
    dist       <- as.data.frame(cbind(varDist, muDist))
    distL[[k]] <- dist

# Advance

    k <- k+1 
    i <- i+1

  }

  var     <- do.call(rbind, varL)
  mu      <- do.call(rbind, muL)
  n       <- do.call(rbind, nL)
  eVar    <- do.call(rbind, eVarL)
  normsDf <- as.data.frame(cbind(mu, var, eVar, n)) 
  colnames(seDf) <- c("mu", "var", "evar", "n")
  normsDf$order <- c(1:33)

新しいサンプルが追加されるたびにおよびどのように変化するかを示すパス図を次に示します。EμEσ2

ここに画像の説明を入力してください

以下は、更新ごとの平均と分散の推定分布からのサンプリングに基づく密度です。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

他の人に役立つ場合にだけこれを追加したかったので、知識のある人がこれが理にかなっているか、欠陥があるかなどを教えてくれます

回答:


11

2つのアプローチ(メタ分析とベイジアン更新)は、実際にはそれほど明確ではありません。メタ分析モデルは、実際には、ベイズモデルとしてフレーム化されることがよくあります。なぜなら、手元の現象についての事前知識(おそらくかなりあいまい)に証拠を追加するという考えは、メタ分析に自然に役立つからです。この接続について説明している記事は次のとおりです。

ブランニック、MT(2001)。テスト検証のための経験的ベイズメタ分析の意味。Journal of Applied Psychology、86(3)、468-480。

(著者はメタ分析の結果の測定値として相関を使用しますが、測定方法に関係なく原理は同じです)。

メタ分析のベイジアン手法に関するより一般的な記事は次のとおりです。

サットン、AJ、およびエイブラムス、KR(2001)。メタ分析と証拠合成におけるベイジアン手法。医学研究の統計的手法、10(4)、277-303。

後のように見えるのは、いくつかの組み合わせた推定値に加えて、将来の研究で真の結果/効果が低下する可能性が高い予測/信頼性の間隔です。「従来の」メタ分析またはベイジアンメタ分析モデルからこのような間隔を取得できます。従来のアプローチは、たとえば次のように説明されています。

Riley、RD、Higgins、JP、およびDeeks、JJ(2011)。変量効果のメタ分析の解釈。British Medical Journal、342、d549。

ベイズモデルの文脈で(テイクは、例えば、ランダム効果モデルは、サットン・エイブラムス、2001年の論文で、式6によって記述)、一つは簡単の事後分布を取得することができる、ここで真であります番目の研究の結果/効果(これらのモデルは通常MCMCを使用して推定されるため、適切なバーンイン期間後にのチェーンを監視する必要があります)。その事後分布から、信頼区間を取得できます。θ I I θ Iθθθ


3
それに加えて、メタ分析の結果から多くのベイジアン事前分布が作成されています。
フォマイト

2

yjNμσ2=1njj=1Kμ

μ^=1Nj=1Knjy¯jN=j=1Knj
σσ2
σ2=1NKj=1Knj1sj2
NK
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.