統計とビッグデータ meta-regression

2

農業試験に関するデータセットがあります。私の応答変数は応答率です：log（treatment / control）。私は違いを媒介するものに興味があるので、REメタ回帰を実行しています（重みなし、効果の大きさは推定値の分散と無相関であることが明らかだからです）。各研究では、穀物収量、バイオマス収量、またはその両方が報告されています。研究されたすべての植物が穀物に役立つわけではないので（例えばサトウキビが含まれているため）、バイオマス収量だけを報告する研究から穀物収量を推定することはできません。しかし、穀物を生産する各植物にはバイオマスもありました。不足している共変量については、反復回帰代入を使用しています（Andrew Gelmanの教科書の章に続きます）。合理的な結果が得られるようで、プロセス全体は一般的に直感的です。基本的に、欠損値を予測し、それらの予測値を使用して欠損値を予測し、各変数がほぼ収束するまで（分布で）各変数をループします。同じプロセスを使用して欠落した結果データを補完できない理由はありますか？穀物の反応率、作物の種類、および私が持っている他の共変量を考えると、おそらくバイオマスの反応率の比較的有益な補完モデルを形成できます。次に、係数とVCVを平均し、標準的な方法に従ってMI補正を追加します。しかし、結果自体が帰属する場合、これらの係数は何を測定しますか？係数の解釈は共変量の標準MIとは異なりますか？考えてみると、これが機能しないことを納得することはできませんが、よくわかりません。資料を読むための考えや提案を歓迎します。

17 missing-data meta-analysis multiple-imputation meta-regression

2

メタ回帰の独立変数として効果サイズを含めることはできますか？

私の質問は、メタ回帰で、効果サイズを従属変数として使用し、別の効果サイズを独立変数として使用できるかどうかです。XXXYYY たとえば、飲酒問題における運動の影響についてメタ分析を実施したところ、有意な結果と高い不均一性が見つかりました。メタ回帰を行い、不安へのそれらの介入の効果サイズを独立変数として使用し、飲酒問題の効果サイズを従属変数として使用したい（各研究が不安と飲酒問題の両方を評価し、その効果を計算した場合）ヘッジのとしてのサイズ）。ggg これはあなたにとって意味がありますか？

11 references meta-analysis effect-size meta-regression

1

R / mgcv：なぜte（）とti（）テンソル積が異なる表面を生成するのですか？

のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています（非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか）。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)（わずかに）異なる結果を生成するのかということです。 MWE（から適応?ti）： require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

1

PET-PEESEとメタ分析へのマルチレベルアプローチの間で引き裂かれた：幸せな媒体はありますか？

現在、メタ分析に取り組んでいます。そのため、サンプル内にネストされた複数の効果サイズを分析する必要があります。他の可能な戦略の一部とは対照的に、Cheung（2014）の3レベルのメタ分析アプローチによる依存効果サイズのメタ分析（たとえば、依存関係の無視、研究内の効果サイズの平均化、1つの効果サイズの選択、または分析単位のシフト）。私の依存するエフェクトサイズの多くは相関関係であり、かなり独特の（ただし、局所的に関連する）変数が含まれているため、それらを平均しても概念的に意味がありません。ただし、同時に、メタ分析の影響を推定する過程で、出版バイアスに対処するためのStanley＆Doucouliagos（2014）の方法を使用することにも興味があります。簡単に言うと、メタ回帰モデルを当てはめて、それぞれの分散（精度効果テスト、PET）またはそれぞれの標準誤差（標準誤差を含む精度効果推定、またはPEESE）によって研究効果サイズを予測します。PETモデルの切片の重要性に応じて、PETモデルからの切片（PET切片p > .05の場合）またはPEESEモデル（PET切片p <.05の場合）を推定されたパブリケーションとして使用します。バイアスのない平均効果サイズ。私の問題は、しかし、スタンレーとドゥクーリアゴス（2014）のこの抜粋に起因します。私たちのシミュレーションでは、原因不明の過剰な異質性が常に含まれています。したがって、従来の慣例では、REE [ランダム効果推定量]はFEE [固定効果推定量]よりも優先されます。ただし、出版物の選択がある場合、従来の方法は間違っています。統計的有意性の選択により、REEは常にFEEよりバイアスされます（表3）。この予測可能な劣等性は、REE自体が最大の出版バイアスを持つ単純平均とFEEの加重平均であるという事実によるものです。この一節から、変量効果/混合効果メタ分析モデルでPET-PEESEを使用するべきではないと信じるようになりましたが、マルチレベルのメタ分析モデルには変量効果推定量が必要なようです。私は何をすべきかについて引き裂かれています。依存しているすべての効果サイズをモデル化できるようにしたいのですが、同時にこの特定の方法で出版バイアスを補正しています。3レベルのメタ分析戦略をPET-PEESEと合法的に統合する方法はありますか？参考文献 Cheung、MWL（2014）。3レベルのメタ分析による依存効果サイズのモデリング：構造方程式モデリングアプローチ。心理的方法、19、211から229まで。 Stanley、TD、＆Doucouliagos、H.（2014）。出版物選択バイアスを減らすためのメタ回帰近似。研究の合成方法、5、60から78。

10 multilevel-analysis meta-analysis meta-regression publication-bias

2

変量効果メタ分析の代替重み付けスキーム：標準偏差の欠落

私は、標準偏差を報告しない多くの研究をカバーする変量効果メタ分析に取り組んでいます。すべての研究はサンプルサイズを報告しています。SDの欠損データを概算または推定することはできないと思います。すべての研究で標準偏差が利用できない場合、生の（非標準化）平均差を効果サイズとして重み付けするメタ分析はどのように重み付けする必要がありますか？もちろん、タウ2乗を推定することもできます。ランダム効果フレームワーク内に留まるために使用する重み付けスキームに、スタディ間の分散の測定値を組み込みたいと思います。もう少し情報が含まれています：生の平均値の差が依然として有用である理由：データは、本質的に意味のあるスケール（単位あたりの米ドル）で報告されます。したがって、平均差のメタ分析はすぐに解釈できます。 SDデータを概算または推定できない理由：標準偏差データが欠落している研究には、標準偏差を概算するのに十分なデータが含まれていません（つまり、中央値と範囲が文献で報告されることはありません）。研究の大部分がsdを欠いているため、欠落しているデータを補うことはお勧めできません。これは、研究が対象地域と調査プロトコルの点で大きく異なるためです。メタアナリシスの生の平均差で通常行われること：研究の重みは、平均差の標準誤差に基づいています（通常、サンプルサイズの項とプールされた分散で計算されます）。これを持っていない。変量効果メタ分析では、研究の重みには、研究間の分散の用語も含まれます。これがあります。このコンテキストで単純な逆サンプルサイズの重み付けを使用できますか？タウ2乗の推定値（または研究間の分散のその他の測定値）を重み付けにどのように組み込みますか？

9 stata missing-data meta-analysis meta-regression

2

メタ分析でサブスコアを最適に処理するにはどうすればよいですか？

metaforパッケージを使用して、Rの効果サイズdのメタ分析を行っています。dは、患者と健常者の間の記憶スコアの違いを表します。ただし、一部の研究では、関心のある測定のサブスコアd（たとえば、いくつかの異なるメモリスコアまたはメモリテストの3つの個別のブロックからのスコア）のみを報告しています。以下のダミーデータセットを参照してください。dは、研究の効果サイズと標準偏差sdを表しています。 d <- round(rnorm(5,5,1),2) sd <- round(rnorm(5,1,0.1),2) study <- c(1,2,3,3,3) subscore <- c(1,1,1,2,3) my_data <- as.data.frame(cbind(study, subscore, d, sd)) library(metafor) m1 <- rma(d,sd, data=my_data) summary(m1) これらのサブスコアを処理する最良の方法について、あなたの意見を伺いたいと思います-例：複数のスコアを報告する各調査から1つのサブスコアを選択します。すべてのサブスコアを含める（1つの研究のサブスコアが同じサンプルに由来するため、これはrfxモデルの独立性の仮定に違反します）サブスコアを報告する各スタディについて：平均スコアと平均標準偏差を計算し、この「マージされた効果サイズ」をrfxメタ分析に含めます。すべてのサブスコアを含め、特定のスコアがどのスタディから派生したかを示すダミー変数を追加します。

9 r meta-analysis effect-size meta-regression

1

マルチレベルの多変量メタ回帰

背景：（1）いくつかの結果/構造（=多変量）と（2）異なる測定値のためにこれらの結果のすべてに複数の効果サイズがある研究を使用してメタ回帰を実行したいと思います。うまくいけばそれを最もよく説明するスキームがあります：研究1、結果A、効果サイズ1 研究1、結果A、効果サイズ2 研究1、結果B、効果サイズ3 研究2、結果A、効果サイズ4 研究2、結果C、効果サイズ5 研究2、結果C、効果サイズ6 ... 研究は、異なる結果について2つのグループの平均を比較し、効果の大きさはヘッジのgです。実用的な例は「ワーキングメモリー」であり、「音韻ループ」、「視覚空間スケッチパッド」、「中央エグゼクティブ」など、さまざまな結果に分割できます（Baddeley、1974）。たとえば、スタディ1は2つの異なるメジャー（=効果サイズ1および2）で「音韻ループ」（結果A）を評価し、1つのメジャー（=効果サイズ3）で「中央エグゼクティブ」（結果B）を評価します。問題：適切な多変量アプローチでは、共分散を推定するために、効果サイズと結果の間のすべての相関関係を知る必要があります。ただし、（1）同じ研究内の異なる効果サイズ間の相関関係、および（2）異なる研究の結果間の相関関係はわかりません。それらを推定したり、少なくともいくつかの相関関係を見つけて作業したりすることはできますが、それは避けたい多くの追加の文献検索を意味します。解決策（これまでのところ）：私は同様の問題を扱ういくつかの方法に出くわしました。ロバストな分散推定（Hedges、2010）は、複数の効果サイズを処理するための優れたアプローチです。ただし、まだ相関関係を推測して感度分析を実行する必要があり、いくつかの結果を比較することもできないようです（つまり、単変量メタ回帰のみ）。 Van den Noorgateのマルチレベルアプローチ（2014）は、研究内の効果サイズ間および効果サイズ間での変動を可能にすることで相関を推定する必要がないため、有望です。マルチレベルの多変量メタ分析（=異なる結果と上記のスキームのような複数の効果サイズ）とマルチレベルの単変量メタ回帰（=複数の効果サイズですが、結果間の区別なし）について説明します。 Rでmetaforパッケージを使用して、両方のマルチレベルアプローチを組み合わせて、マルチレベルの多変量メタ回帰を実行できるかどうか疑問に思っています。metaforがここに与えられている使用してマルチレベルのメタ分析と多変量メタ回帰の例http://www.metafor-project.org/doku.php/analyses:konstantopoulos2011ここ（マルチレベル）とのhttp：//www.metafor- project.org/doku.php/analyses:berkey1998（多変量）。（上にリンクされたマルチレベルの例は、実際には階層的な依存関係に対処するアプローチを説明していることに注意してください（たとえば、同じ研究室で実施された研究）。代わりに、Van den Noorgateによって説明されたマルチレベルのアプローチを使用します。）変数： ES：効果サイズ（ヘッジのg） VI：効果サイズの分散 Pub_Year：メタ回帰の予測子としての発行年 ES_ID：すべての効果サイズには、所属する研究または結果に関係なく、一意のIDがあります。 Outcome_ID：所属する研究に関係なく、同じ結果のIDは同じです（たとえば、「Phonological Loop」= 1、「Central Executive」= 2）。 Study_ID：同じ研究の効果サイズは、それらが属する結果に関係なく、同じIDを持ちます（例：研究1の効果サイズ= 1、研究2 = 2の効果サイズ）。多レベルの多変量メタ分析のためのメタフォーのRコード： rma.mv（ES、VI、mods =〜Outcome_ID -1、random = list（〜1 | Study_ID、〜1 | ES_ID）、data = data.set） …

8 multivariate-analysis multilevel-analysis meta-analysis meta-regression

1

メタ回帰の奇妙に大きなR二乗値（metafor）

私はRでmetaforパッケージを使用しています。次のように、連続予測子を使用して変量効果モデルを適合させました SIZE=rma(yi=Ds,sei=SE,data=VPPOOLed,mods=~SIZE) これは出力を生成します： R^2 (amount of heterogeneity accounted for): 63.62% Test of Moderators (coefficient(s) 2): QM(df = 1) = 9.3255, p-val = 0.0023 Model Results: se zval pval ci.lb ci.ub intrcpt 0.3266 0.1030 3.1721 0.0015 0.1248 0.5285 ** SIZE 0.0481 0.0157 3.0538 0.0023 0.0172 0.0790 ** 以下では、回帰をプロットしています。効果サイズは、標準誤差の逆数に比例してプロットされています。これは主観的な発言であることは承知していますが、R2（63％の分散の説明）の値は、プロットに示されている適度な関係（重みを考慮した場合でも）が反映する値よりもはるかに大きく見えます。私が何を意味するかを示すために、次にlm関数で同じ回帰を行う場合（同じ方法で学習の重みを指定）： lmod=lm(Ds~SIZE,weights=1/SE,data=VPPOOLed) 次に、R2は28％の分散に下がります。これは、物事のあり方（または少なくとも、どのようなR2がプロットに対応するべきかという私の印象）に近いようです。 …

8 r meta-analysis meta-regression

タグ付けされた質問 「meta-regression」

タグ付けされた質問「meta-regression」