統計的に有意な分析と有意でない分析でイータ平方/部分イータ平方の解釈と報告方法は?


39

グループ平均差の効果サイズの尺度として計算されたイータ2乗値と部分イータ2乗値を持つデータがあります。

  • イータ平方と部分イータ平方の違いは何ですか?同じCohenのガイドラインを使用して両方を解釈できますか(1988年:0.01 =小、0.06 =中、0.13 =大)

  • また、比較テスト(すなわち、t検定または一元配置分散分析)が有意でない場合、効果のサイズを報告するのに使用はありますか?私の頭では、これは「平均差は統計的有意性に達しなかったが、イータの2乗から示される効果の大きさは中程度であるため、依然として注目に値する」と言っているようなものです。または、効果サイズは、補完的なものではなく、有意性テストの代替値ですか?


実際、SPSSはすべてのANOVAの部分イータ平方を計算します。これにより、単一IV独立グループデザインのイータ2乗と同じ値が得られますが、単一IV反復測定デザインでは異なる値になります。これは私の学生に問題を終わらせません。

回答:


43

グループ平均差の効果サイズ

  • 一般的に、標準化されたグループ平均差(例、コーエンのd)は、グループ差のコンテキスト内でより意味のある効果サイズの尺度であることがわかります。η平方のような尺度は、グループサンプルのサイズが等しいかどうかに影響されますが、コーエンのdは等しくありません。また、定量化しようとしているものがグループ平均の違いである場合、dベースのメジャーの意味はより直感的だと思います。
  • 上記の点は、グループが2つしかない場合(治療の効果とコントロールの効果など)に特に強力です。3つ以上のグループがある場合、状況はもう少し複雑です。この場合、分散の説明された測定値の引数を見ることができます。あるいは、Cohenのf2は別のオプションです。
  • 3番目のオプションは、実験効果のコンテキスト内で、3つ以上のグループがある場合でも、効果の概念はバイナリ比較(つまり、ある条件と別の条件の効果)として概念化するのが最適です。この場合、再びdベースのメジャーに戻ることができます。dベースのメジャーは、因子の効果サイズのメジャーではなく、参照グループに関連する1つのグループのメジャーです。重要なのは、意味のある参照グループを定義することです。
  • 最後に、エフェクトサイズの測定値を含めるという幅広い目的を覚えておくことは重要です。読者に興味のある効果の大きさの感覚を与えることです。標準化された効果の尺度は、このタスクで読者を支援する必要があります。従属変数が本質的に意味のあるスケールにある場合、そのスケールに関して効果の大きさを解釈することをためらわないでください。たとえば、反応時間、給与、身長、体重などの尺度は本質的に意味があります。私のように、実験的効果のコンテキスト内でイータが少し直感的でないとわかった場合、別のインデックスを選択する可能性があります。

イータ平方と部分イータ平方

  • 部分イータ2乗は、SPSSのいくつかのANOVAプロシージャで報告されるデフォルトの効果サイズ測定です。これが私が頻繁に質問を受ける理由だと思います。
  • 予測変数が1つしかない場合、部分イータ2乗はイータ2乗と同等です。
  • この記事では、イータ2乗と部分イータ2乗の違いについて説明します(Levine and Hullett Eta Squared、Partial Eta Squared ..)。
  • 要約すると、複数の予測変数がある場合、部分イータ2乗は、他の予測変数によって説明される分散を除外した後に残る分散の特定の変数によって説明される分散です。

イータ平方と部分イータ平方の経験則

  • 予測子が1つだけの場合、ηの2乗と部分的なetaの2乗は同じであるため、同じ経験則が適用されます。
  • 予測子が複数ある場合、イータ2乗の一般的な経験則は、イータ2乗よりも部分イータ2乗に多く適用されると思います。これは、因子ANOVAでの部分イータ2乗が、一元配置分散分析であった場合の因子のイータ2乗の近似値にほぼ間違いなく近いためです。そして、それはおそらく一方向の分散分析であり、コーエンの経験則を生み出したものです。一般に、実験計画に他の要因を含めると、通常、ηの2乗が減少しますが、2番目の要因が影響を与える場合、従属変数の変動性が増加するため、必ずしも部分的な2乗は減少しません。
  • イータ2乗と部分イータ2乗の経験則について私が言っていることにもかかわらず、私は実験効果のサイズと意味を解釈する文脈内で効果サイズの測定を説明した分散のファンではないことを繰り返します。同様に、経験則は単なるラフで、コンテキストに依存しており、あまり真剣に受け取らないでください。

重要な結果と重要でない結果のコンテキストでの効果サイズの報告

  • ある意味では、研究の目的は、母集団における対象変数の影響のさまざまな定量的推定値を推定することです。
  • 効果のサイズは、この効果のポイント推定値の1つの定量化です。サンプルサイズが大きいほど、一般的に、サンプルポイントの推定値は真の母集団効果に近くなります。
  • 大まかに言えば、有意性テストの目的は、結果の説明としてチャンスを排除することです。したがって、p値は、帰無仮説が真であると仮定して、より極端な、またはより極端な効果サイズを観測する確率を示します。
  • 最終的には、効果を除外せず、真の人口効果の大きさについて何か言いたいと思うでしょう。効果サイズに関する信頼区間と信頼区間は、この問題をより直接的に解決する2つのアプローチです。ただし、p値と効果サイズのポイント推定値の報告は非常に一般的であり、p値のみまたは効果サイズ測定のみを報告するよりもはるかに優れています。
  • 特定の質問に関して、重要でない結果がある場合は、効果サイズの測定値を報告するかどうかを決定します。多くの結果を含むテーブルがある場合、重要度に関係なく使用されるエフェクトサイズの列を使用することは理にかなっています。有意ではない状況でも、信頼区間のある効果の大きさは、有意でない結果が不十分なサンプルサイズによるものである可能性があるかどうかを示すのに役立ちます。

1
こんにちはジェレミー-「要因ANOVAの部分イータ2乗は、一元配置ANOVAの場合の因子のイータ2乗がほぼ間違いなく近似する」と言うとき、あなたとは異なります。実際、予測変数が単独で使用された場合のetaの2乗は、他の予測変数の会社での部分的なetaの2乗よりもはるかに大きくなる傾向があります。後者の場合、結果で説明された分散の分散は、問題の予測変数に加算されません。前者では、説明された分散に対する「競合」がないため、予測変数は、結果との重複を示します。
rolando2

3
@ rolando2おそらく、私の論点はあいまいでした。私は計画された実験に言及しています。実験1が因子Aを操作し、実験2 AとBを操作するとします。バランスのとれた設計を仮定すると、両方の因子は直交します。両方の要因が分散を説明すると仮定すると、実験2の要因Aによって説明される分散は、要因1の場合よりも小さくなり、要因Bのレベルは一定に保たれます。したがって、要因実験と1因子実験を比較すると、特に相互作用効果がない場合、部分イータ2乗は要因実験と1因子実験でより類似していると思います。
ジェロミーアングリム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.