コーエンの


12

Cohenのは、エフェクトのサイズを測定する最も一般的な方法の1つです(Wikipediaを参照)。プールされた標準偏差に関して2つの平均間の距離を単純に測定します。Cohenのdの分散推定の数式をどのように導出できますか? dd

2015年12月編集:この質問に関連するのは、dの周りの信頼区間計算するという考え方です。この記事でd

σd2=n+n×+d22n+

ここで、は2つのサンプルサイズの合計であり、n ×は2つのサンプルサイズの積です。n+n×

この式はどのように導出されますか?


@Clarinetist:他の人の質問を編集して、より多くの実質とより多くの質問を追加することは(文言を改善するのではなく)幾分物議を醸しています。私はあなたの編集を承認するために自由を取りました(あなたが寛大な賞金を置いて、あなたの編集が質問を改善すると思うと)、他の人はロールバックすることを決めるかもしれません。
アメーバは、モニカを復活させる

1
@amoeba問題ありません。式がためにそこにある長いほど(前無かった)、それは私たちが式の数学的な導出を探していることは明らかだ、の罰金という。σd2
クラリネット奏者

2番目の分数の分母はなければなりません。以下の私の答えをご覧ください。2(n+2)

回答:


15

質問の分散式は近似値であることに注意してください。 Hedges(1981)は、一般的な設定(すなわち、複数の実験/研究)で大きなサンプル分散と近似を導き出しました。そして、私の答えは、論文の派生物をほとんど通り抜けます。d

まず、利用する前提は次のとおりです。

2つの独立した治療グループ、(治療)とC(対照)があるとします。ましょうY T IY C jはどの被験者からのスコア/応答/ BE I群におけるT被写体J群でC、夫々 。TCYTiYCjiTjC

応答は正規分布であり、治療群と対照群は共通の分散を共有していると仮定します。

YTiN(μT,σ2),i=1,nTYCjN(μC,σ2),j=1,nC

私たちはそれぞれの研究で推定することに興味が効果の大きさは、。私たちが使用します効果の大きさの推定がある D= ˉ Y T- ˉ Y Cδ=μTμCσ ここで、S2kはグループkの不偏サンプル分散です。

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2
Sk2k

大標本プロパティを考えてみましょう。 d

まず、ノートその: 及び()私の表記とルーズである: N T - 1 S 2 T

Y¯TY¯CN(μTμC,σ2nT+nCnTnC)
および NC-1S 2 C
(1)(nT1)ST2σ2(nT+nC2)=1nT+nC2(nT1)ST2σ21nT+nC2χnT12
(2)(nC1)SC2σ2(nT+nC2)=1nT+nC2(nC1)SC2σ21nT+nC2χnC12

1σ2(nT1)ST2+(nC1)SC2nT+nC21nT+nC2χnT+nC22

今、いくつかの巧妙な代数:

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2=(σnT+nCnTnC)1(Y¯TY¯C)(σnT+nCnTnC)1(nT1)ST2+(nC1)SC2nT+nC2=(Y¯TY¯C)(μTμC)σnT+nCnTnC+μTμCσnT+nCnTnC(nT+nCnTnC)1(nT1)ST2+(nC1)SC2σ2(nT+nC2)=nT+nCnTnC(θ+δnTnCnT+nCVν)
where θN(0,1), Vχν2, and ν=nT+nC2. Thus, d is nT+nCnTnC times a variable which follows a non-central t-distribution with nT+nC2 degrees of freedom and non-centrality parameter of δnTnCnT+nC.

Using the moment properties of the non-central t distribution, it follows that:

(3)Var(d)=(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2b2
where
b=Γ(nT+nC22)nT+nC22Γ(nT+nC32)134(nT+nC2)1

So Equation (3) provides the exact large sample variance. Note that an unbiased estimator for δ is bd, with variance:

Var(bd)=b2(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2

For large degrees of freedom (i.e. large nT+nC2), the variance of a non-central t variate with ν degrees of freedom and non-centrality parameter p can be approximated by 1+p22ν (Johnson, Kotz, Balakrishnan, 1995). Thus, we have:

Var(d)nT+nCnTnC(1+δ2(nTnCnT+nC)2(nT+nC2))=nT+nCnTnC+δ22(nT+nC2)

Plug in our estimator for δ and we're done.


Very, very nice derivation. Just a few questions: 1) could you clarify what the notation Y¯iTY¯iC means (I know it's something to do with difference of sample means, but how can they both have the same index?)? 2) could you clarify how the approximation for b is done (I don't need all of the details, a source is fine and maybe a brief explanation)? Otherwise, I'm quite pleased with this. (+1) This also agrees with the observation that I've made that d doesn't follow a normal distribution, contrary to the explanation in the linked article in the OP.
Clarinetist

@Clarinetist Thanks! 1) How can they have the same index? Typo, that's how! :P They're an artifact of my first draft of the answer. I'll fix that. 2) I pulled it from the Hedges paper -- don't know its derivation at the moment but will think about it some more.

I'm looking into the derivation now, but FYI, the numerator of b should be Γ(nT+nC22).
Clarinetist

Derivation provided for reference: math.stackexchange.com/questions/1564587/… . Turns out there's likely a sign error.
Clarinetist

@mike : very impressing answer. Thanks for taking the time to share it with us.
Denis Cousineau
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.