タグ付けされた質問 「meta-analysis」

精度と外部妥当性の向上を期待して、さまざまな研究の結果を対比して組み合わせることに焦点を当てた方法。

1
Metaforパッケージ:バイアスと感度の診断
複数の結果を持ついくつかの記事を含むマルチレベルのメタ分析を行っています。そのため、rma.mv()関数を使用しています。コード例: test.main = rma.mv(yi,vi,random = ~1|ID, data = data) 2つの質問があります。 私は以前に読んクエリ使用している場合があることrma.mv()、ranktest()ファンネルプロットの非対称性の信頼性テストではありません。ただし、サンプル分散がモデレーターとして元のモデルに追加された場合、このモデルはエッガーの検定に似ています。 test.egger = rma.mv(yi,vi, mod = vi, random = ~1|ID, data = data) このコードはそのガイダンスの正しい解釈ですか?また、ファンネルプロットも(多かれ少なかれ)rma.mv()モデルのツールとして役に立たないのですか? また、モデルの結果の感度を評価するためにleave1out()もtrimfill()機能しませんrma.mv()。rma.mv()Rの熟練した理解を必要としないモデルで現在利用可能な他の感度分析ツールはありますか?

2
変量効果メタ分析の代替重み付けスキーム:標準偏差の欠落
私は、標準偏差を報告しない多くの研究をカバーする変量効果メタ分析に取り組んでいます。すべての研究はサンプルサイズを報告しています。SDの欠損データを概算または推定することはできないと思います。すべての研究で標準偏差が利用できない場合、生の(非標準化)平均差を効果サイズとして重み付けするメタ分析はどのように重み付けする必要がありますか?もちろん、タウ2乗を推定することもできます。ランダム効果フレームワーク内に留まるために使用する重み付けスキームに、スタディ間の分散の測定値を組み込みたいと思います。 もう少し情報が含まれています: 生の平均値の差が依然として有用である理由:データは、本質的に意味のあるスケール(単位あたりの米ドル)で報告されます。したがって、平均差のメタ分析はすぐに解釈できます。 SDデータを概算または推定できない理由:標準偏差データが欠落している研究には、標準偏差を概算するのに十分なデータが含まれていません(つまり、中央値と範囲が文献で報告されることはありません)。研究の大部分がsdを欠いているため、欠落しているデータを補うことはお勧めできません。これは、研究が対象地域と調査プロトコルの点で大きく異なるためです。 メタアナリシスの生の平均差で通常行われること:研究の重みは、平均差の標準誤差に基づいています(通常、サンプルサイズの項とプールされた分散で計算されます)。これを持っていない。変量効果メタ分析では、研究の重みには、研究間の分散の用語も含まれます。これがあります。 このコンテキストで単純な逆サンプルサイズの重み付けを使用できますか?タウ2乗の推定値(または研究間の分散のその他の測定値)を重み付けにどのように組み込みますか?

2
メタ分析でサブスコアを最適に処理するにはどうすればよいですか?
metaforパッケージを使用して、Rの効果サイズdのメタ分析を行っています。dは、患者と健常者の間の記憶スコアの違いを表します。ただし、一部の研究では、関心のある測定のサブスコアd(たとえば、いくつかの異なるメモリスコアまたはメモリテストの3つの個別のブロックからのスコア)のみを報告しています。以下のダミーデータセットを参照してください。dは、研究の効果サイズと標準偏差sdを表しています。 d <- round(rnorm(5,5,1),2) sd <- round(rnorm(5,1,0.1),2) study <- c(1,2,3,3,3) subscore <- c(1,1,1,2,3) my_data <- as.data.frame(cbind(study, subscore, d, sd)) library(metafor) m1 <- rma(d,sd, data=my_data) summary(m1) これらのサブスコアを処理する最良の方法について、あなたの意見を伺いたいと思います-例: 複数のスコアを報告する各調査から1つのサブスコアを選択します。 すべてのサブスコアを含める(1つの研究のサブスコアが同じサンプルに由来するため、これはrfxモデルの独立性の仮定に違反します) サブスコアを報告する各スタディについて:平均スコアと平均標準偏差を計算し、この「マージされた効果サイズ」をrfxメタ分析に含めます。 すべてのサブスコアを含め、特定のスコアがどのスタディから派生したかを示すダミー変数を追加します。

1
逆分散重み付けに関する質問
我々は観測されない実現に推論を作りたいとしの確率変数の〜X通常平均と一緒に配布され、μ X及び分散σ 2 のx。別の確率変数があるとし〜Y(その未観測実現私たちは同様に呼び出しますyは、通常、平均で配布される)μのYと分散σ 2 yは。してみましょうσ のx のyの共分散も〜のxおよび〜yの。xxxx~x〜\tilde xμxμバツ\mu_xσ2バツσx2\sigma^2_xy〜y〜\tilde yyyyμyμy\mu_yσ2yσy2\sigma^2_yσx yσバツy\sigma_{xy}バツ〜バツ〜\tilde xy〜y〜\tilde y 今、我々は上の信号を観察すると仮定し、 = X + 〜U、〜U〜N(0 、φ 2 X)、及び上の信号Y、 B = Y + 〜V、〜V〜N(0 、φ 2 Y)。仮定〜Uと〜vは独立しています。バツバツxa = x + u〜、a=バツ+あなた〜、\begin{align}a=x+\tilde u,\end{align}あなた〜〜N(0 、ϕ2バツ)あなた〜〜N(0、φバツ2)\tilde u\sim\mathcal{N}(0,\phi_x^2)yyyb = y+ v〜、b=y+v〜、\begin{align}b=y+\tilde v,\end{align}v〜〜N(0 、ϕ2y)v〜〜N(0、φy2)\tilde v\sim\mathcal{N}(0,\phi_y^2)あなた〜あなた〜\tilde uv〜v〜\tilde v aとbを条件としたの分布は何ですか?バツバツxaaabbb これまでに知っていること: 逆分散重み付け および Var(xE(x|a )= …

1
メタアナリシスを伴うフリークエンティストアプローチとベイジアンアプローチの違いは何ですか?
特定の健康指標を調べて分析しているとしましょう。患者と対照の測定値の違い、およびその差が0と異なるかどうかに興味があります。過去に同じ研究課題と健康測定値を調べた研究がありましたが、患者のサンプルが異なっていました。 ベイジアン分析では、平均差と標準誤差を組み込んだ以前の研究に基づいて、事前分布を作成します。 ベイジアン統計を新しく学習しているため、これが初心者の質問である場合は許してください。ただし、ベイジアン分析の結果は、逆分散加重メタ分析を使用して得られる結果とどのように異なるのでしょうか。現在のデータを使用した以前の研究?

2
混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックブートストラップ
以下の移植片は、この記事から引用したものです。私はブートストラップの初心者であり、R bootパッケージを使用した線形混合モデルのパラメトリック、セミパラメトリック、ノンパラメトリックのブートストラップブートストラップを実装しようとしています。 Rコード これが私のRコードです: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) Out ご質問 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
オッズ比の標準誤差を計算する方法は?
ゲノムワイド関連研究からの2つのデータセットがあります。利用できる唯一の情報は、オッズ比と最初のデータセットのp値です。2番目のデータセットには、オッズ比、p値、および対立遺伝子頻度(AFD =疾患、AFC =コントロール)があります(例:0.321)。これらのデータのメタ分析を実行しようとしていますが、これを実行するための効果サイズパラメーターがありません。提供された情報のみを使用して、これらの各データのSEおよびOR信頼区間を計算する可能性はありますか? 前もって感謝します 例:利用可能なデータ: Study SNP ID P OR Allele AFD AFC 1 rs12345 0.023 0.85 2 rs12345 0.014 0.91 C 0.32 0.25 これらのデータを使用して、SEとCI95%ORを計算できますか?ありがとう

4
メタ分析でプールされた奇数比の信頼区間を計算する方法は?
ゲノムワイド関連研究からの2つのデータセットがあります。利用できる唯一の情報は、遺伝子型別の各SNPの奇数比と信頼区間(95%)です。これらの2つのオッズ比を比較するフォレストプロットを生成したいのですが、合計の信頼区間を計算して要約効果を視覚化する方法が見つかりません。プログラムPLINKを使用して固定効果を使用したメタ分析を実行しましたが、プログラムはこれらの信頼区間を表示しませんでした。 このような信頼区間を計算するにはどうすればよいですか? 利用可能なデータは次のとおりです。 各研究の奇数比、 95%信頼区間と 標準エラー。

3
ゼロ頻度細胞を用いた研究のメタ分析
私はメタ分析とメタ回帰手法(metaforViechtbauer のRパッケージを使用)に精通していますが、最近、簡単に解決できない問題に遭遇しました。母親から胎児へと進行する可能性のある病気があり、それはすでに何度も研究されているとしましょう。母子は出生直後にウイルスの検査を受けた。胎児は母親以外からウイルスを取得する可能性があるため、次のようなクロス集計を期待します。 | neg kid | pos kid mother neg | A | C=0 -----------|---------|-------- mother pos | B | D 明らかにオッズ比(OR)を使用すると、0で除算されるのでエラーが発生します。相対リスクについても同じです。 A/(A+B)0/(0+D)A/(A+B)0/(0+D)\frac{A/(A+B)}{0/(0+D)} 今、研究者たちは、子供の感染が母親の感染に関連しているかどうかの(無意味な)仮説を検証したいと考えています(非常に明白なようです)。私は仮説を再定式化して、意味のある何かを考え出そうとしていますが、実際には何かを見つけることができません。 物事を複雑にするために、ネガティブな母親を持つ一部の子供たちは、おそらく最初の週の感染のために、ポジティブです。したがって、私はC = 0の研究をいくつかしか持っていません。 このようなパターンに従って、さまざまな研究のデータを統計的に要約する方法に関するアイデアは誰でも知っています。科学論文へのリンクも大歓迎です。

2
メタアナリシスでは、生データを含まない重要でない研究をどのように扱うべきですか?
特定の構成に関するグループAとグループBのパフォーマンスを調べて、メタ分析を行っているとしましょう。さて、私が出くわすいくつかの研究は、2つのグループ間で統計的な差が見つからなかったと報告しますが、正確なテスト統計や生データは表示されません。メタ分析では、そのような研究をどのように処理すればよいですか? 基本的に、私はここに3つの異なる選択肢を見ます: それらすべてを含め、それぞれに0の効果サイズを割り当てます。 それらをすべて捨てます。 それらのそれぞれに対してある種の電力分析を行うか、特定の数の参加者にしきい値を設定します。統計的有意性に到達できたはずのすべてを含め、それぞれに効果サイズ0を割り当てます。残りは捨てます。 すべての異なるオプションのメリットを確認できます。オプション1はかなり保守的であり、タイプIIのエラーを発生させるリスクしかありません。オプション2はタイプIのエラーを引き起こすリスクを高めますが、多くの不十分な研究のために結果が台無しになるのを防ぎます。オプション3は、オプション1とオプション2の間の中間のように見えますが、多くの仮定や純粋な推測を行う必要があります(パワー分析のベースとする効果のサイズはどれですか?それぞれに何人の参加者を要求する必要がありますか?合格するための研究?)、おそらく最終結果の信頼性を低下させ、主観性を高めます。

2
メタ分析モデルをブートストラップするときの二峰分布の原因
@Wolfgangが作成したmetafor Rパッケージフレームワークを使用して、同僚がメタ分析混合効果モデルをブートストラップするのを支援します。 興味深いことに、心配なことに、モデルの係数の1つについて、ブートストラップ時に二峰性分布が得られます(下図の右下のパネルを参照)。 主な原因の1つは、ブートストラップ時に、モデルの半分がローカルソリューションに収束し、残りの半分が別のソリューションに収束することであると考えられます。このmetaforドキュメント-rma ()関数での収束問題)で提案されているように、収束アルゴリズムを調整しようとしました。また、rma.mv関数のヘルプドキュメントで提案されているようなbobyqa、他の収束アルゴリズムを試しましたが、同じバイモーダル応答が得られました。newuoa 「ブートストラップ相関のマルチモーダル分布を解釈する方法」で提案されているように、問題のあるグループからいくつかの潜在的な外れ値を排除しようとしましたが、役に立ちませんでした。 データの因子レベルを変更してGitHubにアップロードする以外に、これを再現する方法を見つけることができませんでした(以下のリンクは、ケースのテストに必要なすべてを環境にロードする必要があります)。Linuxクラスターでブートストラップを配列ジョブとして実行します(念のため、シェルスクリプトはjob.shです。これは、各CPUで、以下で説明するモデルを実行するRスクリプトbootstrap.rを実行します)。1回の実行には2〜3分かかります。二峰性応答を検出するには、100回のブートストラップでも十分であることに注意してください。以下は1000回の反復の例です。私はRや他の方法に精通していますが、メタ分析にはそれほど詳しくありません。 二峰性の分布に問題がないかどうか(収束の問題が原因である可能性があります)を理解し、そうでない場合は、どうすればよいですか?(私がすでに試したこと以外に) 以下-ブートストラップ(赤い線)と単一の完全なモデル実行(青い線)からの係数を比較します。ヒストグラムは、各係数のブートストラップ分布を示しています。ブートストラップ用のデータのサンプリングは、2つの固定効果によって形成された各グループ/組み合わせからの置換で選択することで行われました。生のサンプルサイズは次のとおりです。 table(dt$f1, dt$f2) #> #> f2_1 f2_2 f2_3 #> f1_1 177 174 41 #> f1_2 359 363 107 library(data.table) library(ggplot2) library(metafor) #> Loading required package: Matrix #> Loading 'metafor' package (version 2.0-0). For an overview #> and introduction to the package please …

1
マルチレベルの多変量メタ回帰
背景: (1)いくつかの結果/構造(=多変量)と(2)異なる測定値のためにこれらの結果のすべてに複数の効果サイズがある研究を使用してメタ回帰を実行したいと思います。うまくいけばそれを最もよく説明するスキームがあります: 研究1、結果A、効果サイズ1 研究1、結果A、効果サイズ2 研究1、結果B、効果サイズ3 研究2、結果A、効果サイズ4 研究2、結果C、効果サイズ5 研究2、結果C、効果サイズ6 ... 研究は、異なる結果について2つのグループの平均を比較し、効果の大きさはヘッジのgです。 実用的な例は「ワーキングメモリー」であり、「音韻ループ」、「視覚空間スケッチパッド」、「中央エグゼクティブ」など、さまざまな結果に分割できます(Baddeley、1974)。 たとえば、スタディ1は2つの異なるメジャー(=効果サイズ1および2)で「音韻ループ」(結果A)を評価し、1つのメジャー(=効果サイズ3)で「中央エグゼクティブ」(結果B)を評価します。 問題: 適切な多変量アプローチでは、共分散を推定するために、効果サイズと結果の間のすべての相関関係を知る必要があります。ただし、(1)同じ研究内の異なる効果サイズ間の相関関係、および(2)異なる研究の結果間の相関関係はわかりません。それらを推定したり、少なくともいくつかの相関関係を見つけて作業したりすることはできますが、それは避けたい多くの追加の文献検索を意味します。 解決策(これまでのところ): 私は同様の問題を扱ういくつかの方法に出くわしました。 ロバストな分散推定(Hedges、2010)は、複数の効果サイズを処理するための優れたアプローチです。ただし、まだ相関関係を推測して感度分析を実行する必要があり、いくつかの結果を比較することもできないようです(つまり、単変量メタ回帰のみ)。 Van den Noorgateのマルチレベルアプローチ(2014)は、研究内の効果サイズ間および効果サイズ間での変動を可能にすることで相関を推定する必要がないため、有望です。マルチレベルの多変量メタ分析(=異なる結果と上記のスキームのような複数の効果サイズ)とマルチレベルの単変量メタ回帰(=複数の効果サイズですが、結果間の区別なし)について説明します。 Rでmetaforパッケージを使用して、両方のマルチレベルアプローチを組み合わせて、マルチレベルの多変量メタ回帰を実行できるかどうか疑問に思っています。metaforがここに与えられている使用してマルチレベルのメタ分析と多変量メタ回帰の例http://www.metafor-project.org/doku.php/analyses:konstantopoulos2011ここ(マルチレベル)とのhttp://www.metafor- project.org/doku.php/analyses:berkey1998(多変量)。(上にリンクされたマルチレベルの例は、実際には階層的な依存関係に対処するアプローチを説明していることに注意してください(たとえば、同じ研究室で実施された研究)。代わりに、Van den Noorgateによって説明されたマルチレベルのアプローチを使用します。) 変数: ES:効果サイズ(ヘッジのg) VI:効果サイズの分散 Pub_Year:メタ回帰の予測子としての発行年 ES_ID:すべての効果サイズには、所属する研究または結果に関係なく、一意のIDがあります。 Outcome_ID:所属する研究に関係なく、同じ結果のIDは同じです(たとえば、「Phonological Loop」= 1、「Central Executive」= 2)。 Study_ID:同じ研究の効果サイズは、それらが属する結果に関係なく、同じIDを持ちます(例:研究1の効果サイズ= 1、研究2 = 2の効果サイズ)。 多レベルの多変量メタ分析のためのメタフォーのRコード: rma.mv(ES、VI、mods =〜Outcome_ID -1、random = list(〜1 | Study_ID、〜1 | ES_ID)、data = data.set) …

4
なぜストファーの方法が機能するのですか?
かなり簡単な質問のように思えますが、実際に考えると、ストファーの方法は私には意味がありません。これが理由です: 両側仮説を仮定します。最初に、値からを計算します。それでは、かなり単純な例を見てみましょう。 2つの値を取ってみましょう。つまり、とはどちらもです。Stoufferの方法によれば、とは次のように結合されます。 P P 0.05 、Z 1 、Z 2 ≈ 1.96 Z 1 、Z 2z私ziz_ipppppp0.050.050.05z1z1z_1z2z2z_2≈ 1.96≈1.96\approx1.96z1z1z_1z2z2z_2 Z= ∑i = 1kZ私k−−√=1.96+1.962–√=2.77Z=∑i=1kZik=1.96+1.962=2.77 Z = \frac{\sum\limits_{i=1}^kZ_i}{\sqrt{k}} = \frac{1.96 + 1.96}{\sqrt{2}} = 2.77 このスコアは値に再度変換され、値はになりますが、各からの値は個別に約ます。p p 0.005 p z i 0.05zzzpppppp0.0050.0050.005pppziziz_i0.050.050.05 この意味で、Stoufferのテストは結果の値を各値とは異なる値に人工的に変更するように見えますが、私にとっては意味がありません。p z ippppppz私ziz_i 私はこのテストを誤解していますか、それともどのように/なぜそれが機能するのかを理解するのを手伝ってくれますか?

3
ハザード比をオッズ比に変換
メタ分析:一部の研究でハザード比をオッズ比に変換するにはどうすればよいですか?含まれるべきケースコントロールとコホート研究があり、それらのいくつかはハザード比を報告しています。生データは、オッズ比を計算する方法で報告されません。

1
メタ回帰の奇妙に大きなR二乗値(metafor)
私はRでmetaforパッケージを使用しています。次のように、連続予測子を使用して変量効果モデルを適合させました SIZE=rma(yi=Ds,sei=SE,data=VPPOOLed,mods=~SIZE) これは出力を生成します: R^2 (amount of heterogeneity accounted for): 63.62% Test of Moderators (coefficient(s) 2): QM(df = 1) = 9.3255, p-val = 0.0023 Model Results: se zval pval ci.lb ci.ub intrcpt 0.3266 0.1030 3.1721 0.0015 0.1248 0.5285 ** SIZE 0.0481 0.0157 3.0538 0.0023 0.0172 0.0790 ** 以下では、回帰をプロットしています。効果サイズは、標準誤差の逆数に比例してプロットされています。これは主観的な発言であることは承知していますが、R2(63%の分散の説明)の値は、プロットに示されている適度な関係(重みを考慮した場合でも)が反映する値よりもはるかに大きく見えます。 私が何を意味するかを示すために、次にlm関数で同じ回帰を行う場合(同じ方法で学習の重みを指定): lmod=lm(Ds~SIZE,weights=1/SE,data=VPPOOLed) 次に、R2は28%の分散に下がります。これは、物事のあり方(または少なくとも、どのようなR2がプロットに対応するべきかという私の印象)に近いようです。 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.