タグ付けされた質問 「effect-size」

効果の大きさは、「現象の強さの尺度またはその量のサンプルベースの推定」[ウィキペディア]です。

1
コーエンの
Cohenのは、エフェクトのサイズを測定する最も一般的な方法の1つです(Wikipediaを参照)。プールされた標準偏差に関して2つの平均間の距離を単純に測定します。Cohenのdの分散推定の数式をどのように導出できますか? dddddd 2015年12月編集:この質問に関連するのは、dの周りの信頼区間を計算するという考え方です。この記事ではddd σ2d=n+n×+d22n+σd2=n+n×+d22n+\sigma_{d}^2 = \dfrac{n_{+}}{n_{\times}} + \dfrac{d^2}{2n_{+}} ここで、は2つのサンプルサイズの合計であり、n ×は2つのサンプルサイズの積です。n+n+n_{+}n×n×n_{\times} この式はどのように導出されますか?

2
どの記述統計が効果サイズではありませんか?
ウィキペディアによると 効果サイズは、現象の強さの尺度またはその量のサンプルベースの推定値です。データから計算された効果の大きさは、データの見かけの関係が母集団の真の関係を反映しているかどうかについての声明を出さずに、推定される関係の大きさを伝える記述統計です。 それをよりよく理解するために、グラフとプロットを除いて、どの記述統計が効果サイズではないのか疑問に思っていました。

2
ゲルマンとカーリンを理解する「パワー計算を超えて:…」(2014)
GelmanとCarlinの「パワー計算を超えて:タイプS(符号)およびタイプM(マグニチュード)エラーの評価」(2014)を読んでいます。私は主なアイデア、主な理解を理解しようとしていますが、混乱しています。誰かが私に本質を蒸留するのを手伝ってくれる? 紙はこのようなものになります(私が正しく理解した場合)。 心理学の統計的研究は、しばしば小さなサンプルに悩まされます。 特定の研究における統計的に有意な結果を条件として、 (1)真の効果サイズは大幅に過大評価される可能性が高く、 (2)効果の符号は高い確率で反対になる可能性があります(サンプルサイズが十分に大きい場合を除く)。 上記は、母集団における効果サイズの以前の推測を使用して示され、その効果は通常小さいと見なされます。 私の最初の問題は、なぜ統計的に有意な結果の条件なのか、です。それは出版バイアスを反映することですか?しかし、そうではないようです。では、なぜでしょうか。 私の第二の問題は、私は自分自身を勉強をすれば、私は私がするために使用しています異なったよりも、私の結果を扱うべきである(I行うfrequentist統計、ベイズに精通していませんか)?たとえば、データのサンプルを取り、モデルを推定し、関心のある効果とその周りの信頼限界の点推定を記録します。私は今、自分の結果を不信にすべきですか?それとも統計的に有意である場合、それを誤解する必要がありますか?与えられた以前の変化はどうですか? (1)統計調査の「プロ​​デューサー」にとって、および(2)応用統計論文の読者にとっての主な要点は何ですか? 参照: ゲルマン、アンドリュー、ジョンカーリン。「パワー計算を超えて:タイプS(符号)およびタイプM(マグニチュード)エラーの評価。」 心理学の展望 9.6(2014):641-651。 PSここで私にとっての新しい要素は、以前の情報を含めることだと思います。これは、(頻繁なパラダイムから来た)処理方法がわかりません。

2
メタ回帰の独立変数として効果サイズを含めることはできますか?
私の質問は、メタ回帰で、効果サイズを従属変数として使用し、別の効果サイズを独立変数として使用できるかどうかです。XXXYYY たとえば、飲酒問題における運動の影響についてメタ分析を実施したところ、有意な結果と高い不均一性が見つかりました。メタ回帰を行い、不安へのそれらの介入の効果サイズを独立変数として使用し、飲酒問題の効果サイズを従属変数として使用したい(各研究が不安と飲酒問題の両方を評価し、その効果を計算した場合)ヘッジのとしてのサイズ)。ggg これはあなたにとって意味がありますか?

4
研究が過剰に行われるとはどういう意味ですか?
研究が過剰に行われるとはどういう意味ですか? 私の印象では、サンプルサイズが非常に大きく、ごくわずかな効果サイズを検出できるということです。これらの効果サイズはおそらく非常に小さいため、変数間の(必ずしも直接ではない)因果関係よりも、サンプリングプロセスのわずかなバイアスから生じる可能性が高くなります。 これは正しい直感ですか?もしそうなら、結果がそのように解釈され、見積もられた効果サイズが「意味のある」ほど十分に大きいかどうかを手動でチェックして確認する限り、私は大したことが何であるかわかりません。 何か不足していますか?このシナリオで何をすべきかについてより良い推奨事項はありますか?

3
事後処理制御設計における相互作用効果の効果サイズ
混合ANOVAを使用して、連続従属変数を使用して治療前後の制御デザインを分析する場合、治療グループにいることの効果を定量化するさまざまな方法があります。相互作用効果は1つの主要なオプションです。 一般的に、私はコーエンのdタイプのメジャー(つまり、)が特に好きです。結果はグループの相対的なサンプルサイズなどの無関係な要因に基づいて変化するため、分散説明メジャーは好きではありません。μ1- μ2σμ1−μ2σ{\frac{\mu_1 - \mu_2}{\sigma}} そこで、次のように効果を数値化できると考えていました Δのμc= μc 2- μc 1Δμc=μc2−μc1\Delta\mu_c = \mu_{c2} - \mu_{c1} Δのμt= μt 2- μt 1Δμt=μt2−μt1\Delta\mu_t = \mu_{t2} - \mu_{t1} したがって、効果サイズはとして定義できますΔのμt- Δ μcσΔμt−Δμcσ\frac{\Delta\mu_t - \Delta\mu_c}{\sigma} ここで、はコントロール、は治療、1と2はそれぞれ前と後を示します。 は、時間1のプールされた標準偏差である可能性があります。ccctttσσ\sigma 質問: この効果の大きさの測定にラベルを付けることは適切dですか? このアプローチは合理的ですか? そのようなデザインの効果サイズ測定の標準的な方法は何ですか?

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
従属標本t検定のコーエンd
簡単な質問:コーエンのdが従属サンプルのt検定に対して2つの異なる方法を計算するのを見てきました(たとえば、前/後の時点で薬物の有効性をテストするサンプル内設計)。 コーエンdの方程式の分母に変更スコアの標準偏差を使用します。 コーエンdの方程式の分母に事前テストスコアの標準偏差を使用します。 どちらを使用するか、および/またはどちらのオプションをいつ使用するかを実際に説明する文献はほとんど見つかりませんでした。 簡単な考えはありますか?

1
効果サイズの一般的な定義はありますか?
effect-sizeタグにはWikiを持っていません。効果の大きさについてのWikipediaのページには、正確な一般的な定義を提供していません。そして、私はエフェクトサイズの一般的な定義を見たことがありません。しかし、このような議論を読んでいると、統計的検定の文脈において、人々が効果の大きさの一般的な概念を頭に持っているという印象を受けます。標準化された平均は、標準モデルの効果サイズ呼ばれ、標準化された平均差N(μ 、σ 2)θ = (μ 1 - μ 2)/ σθ = μ / σθ=μ/σ\theta=\mu/\sigmaN(μ 、σ2)N(μ,σ2){\cal N}(\mu,\sigma^2)θ = (μ1- μ2)/ σθ=(μ1−μ2)/σ\theta=(\mu_1-\mu_2)/\sigma「2ガウス平均」モデルの場合。しかし、一般的な定義はどうですか?上記の2つの例に共通する興味深い特性は、私が見る限りで は、パワーはを介してのみパラメーターに依存し、増加関数であることです| θ |θθ\theta| θ ||θ||\theta|最初のケースではの通常のテストを検討し、2番目のケースではをます。 H 0:{ μ 1 = μ 2 }H0:{ μ = 0 }H0:{μ=0}H_0:\{\mu=0\}H0:{ μ1= μ2}H0:{μ1=μ2}H_0:\{\mu_1=\mu_2\} このプロパティは、エフェクトサイズの概念の背後にある基本的なアイデアですか?つまり、効果のサイズは単調な1対1の変換まで定義されるということでしょうか。または、より正確な一般的な定義はありますか?

2
二項効果サイズ表示(BESD)は、効果サイズの誤解を招く表現ですか?
ドナルド・ルービンが技術の真のレモンを思いつくことを私が受け入れるのは難しいです。しかし、それはBESD [の私の認識だ1、2、3 ]。 RosenthalとRubin(1982)による元の論文は、「元のデータが連続的であるかカテゴリであるかにかかわらず、製品とモーメントの相関をこのような[2x2]表示に再キャストする方法」を示すことに価値があると主張しました。 下の表はpからのものです。上記の2番目のリンクの451: この手法は、ほとんどすべてのエフェクトサイズの大きさを誇張しているようです。ここでは、元のデータの = .01ですが、2x2の分割表に「変換」すると、はるかに強い影響に直面するようです。この方法でデータをカテゴリカル形式に再キャストすると、 indeed = .1 になることは否定しませんが、翻訳で何かが非常に歪んでいるように感じます。R2R2R^2ϕϕ\phi ここで本当に価値のあるものを見逃していますか?また、過去10年ほどの間に、統計コミュニティはこれを正当な方法として概して拒否しているとの印象を持っています。 実験()と制御()の成功率()をそれぞれ計算する方程式は、単純です。EEECCCsrsrsr Esr=.50+r/2Esr=.50+r/2E_{sr} = .50 + r/2 そして Csr=.50−r/2Csr=.50−r/2C_{sr} = .50 - r/2 参照: Rosenthal、R.&Rubin、DB(1982)。実験効果の大きさの単純な汎用表示。Journal of Educational Psychology、74、166–169。

5
Rでの効果の測定のために2乗したオメガ?
私が読んでいる統計の本は、私の実験の効果を測定するためにオメガ二乗を推奨しています。私は、分割プロット計画(被験者内と被験者間設計の混合)を使用して、被験者内係数がp <0.001およびF = 17で統計的に有意であることをすでに証明しています。 今、私は違いがどれほど大きいかを探しています... R(またはpython?私は知っています...夢を見ることができます;)のどこかにオメガの2乗の実装がありますRに関連するものをインターネットで検索すると痛み*は、私はCでものを見つけるために管理する方法がわかりません ありがとう!

2
分割表のベイジアン分析:効果サイズの記述方法
私は、KruschkeのDoing Bayesian Data Analysisの例、特にch。のポアソン指数ANOVAに取り組んでいます。22、彼は分割表の独立性の頻出カイ二乗検定の代替として提示します。 変数が独立している場合(つまり、HDIがゼロを除外する場合)に予想されるよりも多かれ少なかれ頻繁に発生する相互作用に関する情報を取得する方法を確認できます。 私の質問は、このフレームワークでエフェクトサイズをどのように計算または解釈できるかです。たとえば、クルシュケは「青い目と黒い髪の組み合わせは、目の色と髪の色が独立している場合に予想されるよりも頻度が低い」と書いていますが、その関連付けの強さをどのように説明できますか?どの相互作用が他の相互作用よりも極端かを知るにはどうすればよいですか?これらのデータのカイ2乗検定を行った場合、全体的な効果の大きさの尺度としてCramérのVを計算できます。このベイジアンコンテキストでエフェクトサイズを表現するにはどうすればよいですか? これは、本からの自己完結型の例です(でコード化R)。答えがはっきり見えて私から隠されている場合に備えて... df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", "Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel"))) df Blue Brown Green Hazel Black 20 68 5 15 Blond …

2
メタ分析でサブスコアを最適に処理するにはどうすればよいですか?
metaforパッケージを使用して、Rの効果サイズdのメタ分析を行っています。dは、患者と健常者の間の記憶スコアの違いを表します。ただし、一部の研究では、関心のある測定のサブスコアd(たとえば、いくつかの異なるメモリスコアまたはメモリテストの3つの個別のブロックからのスコア)のみを報告しています。以下のダミーデータセットを参照してください。dは、研究の効果サイズと標準偏差sdを表しています。 d <- round(rnorm(5,5,1),2) sd <- round(rnorm(5,1,0.1),2) study <- c(1,2,3,3,3) subscore <- c(1,1,1,2,3) my_data <- as.data.frame(cbind(study, subscore, d, sd)) library(metafor) m1 <- rma(d,sd, data=my_data) summary(m1) これらのサブスコアを処理する最良の方法について、あなたの意見を伺いたいと思います-例: 複数のスコアを報告する各調査から1つのサブスコアを選択します。 すべてのサブスコアを含める(1つの研究のサブスコアが同じサンプルに由来するため、これはrfxモデルの独立性の仮定に違反します) サブスコアを報告する各スタディについて:平均スコアと平均標準偏差を計算し、この「マージされた効果サイズ」をrfxメタ分析に含めます。 すべてのサブスコアを含め、特定のスコアがどのスタディから派生したかを示すダミー変数を追加します。

3
変換された変数を使用する場合の線形回帰効果のサイズ
線形回帰を実行する場合、従属変数の対数変換などの変換を行って、より良い正規分布の適合を実現すると便利な場合があります。多くの場合、結果の効果サイズ/実際の関連性をより適切に評価するために、回帰からベータを検査することも役立ちます。 これは、たとえば対数変換を使用する場合、効果サイズが対数スケールになるという問題を引き起こします。使用されたスケールの非線形性のために、これらのベータを逆変換すると、意味のない値が得られると言われています実際の使用法はありません。 ここまでは、通常、変換された変数を使用して線形回帰を実行して有意性を検査し、次に元の非変換変数を使用して線形回帰を実行して効果サイズを決定しました。 これを行うための正しい/より良い方法はありますか?ほとんどの場合、臨床データで作業するので、実際の例は、特定の曝露が身長、体重、またはいくつかの実験室測定などの継続的な変数にどのように影響するかを判断することです。重量が2 kg増える」

2
メタアナリシスでは、生データを含まない重要でない研究をどのように扱うべきですか?
特定の構成に関するグループAとグループBのパフォーマンスを調べて、メタ分析を行っているとしましょう。さて、私が出くわすいくつかの研究は、2つのグループ間で統計的な差が見つからなかったと報告しますが、正確なテスト統計や生データは表示されません。メタ分析では、そのような研究をどのように処理すればよいですか? 基本的に、私はここに3つの異なる選択肢を見ます: それらすべてを含め、それぞれに0の効果サイズを割り当てます。 それらをすべて捨てます。 それらのそれぞれに対してある種の電力分析を行うか、特定の数の参加者にしきい値を設定します。統計的有意性に到達できたはずのすべてを含め、それぞれに効果サイズ0を割り当てます。残りは捨てます。 すべての異なるオプションのメリットを確認できます。オプション1はかなり保守的であり、タイプIIのエラーを発生させるリスクしかありません。オプション2はタイプIのエラーを引き起こすリスクを高めますが、多くの不十分な研究のために結果が台無しになるのを防ぎます。オプション3は、オプション1とオプション2の間の中間のように見えますが、多くの仮定や純粋な推測を行う必要があります(パワー分析のベースとする効果のサイズはどれですか?それぞれに何人の参加者を要求する必要がありますか?合格するための研究?)、おそらく最終結果の信頼性を低下させ、主観性を高めます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.