サンプルサイズがパワーに影響する(つまり、1-タイプIIエラー)が、タイプIエラーではないという点で正しい。サンプルサイズが小さい場合、p値自体(正しく解釈された)の信頼性や有効性が低いというのはよくある誤解です。Friston2012の非常に面白い記事はそれについておもしろい見解を持っています[1]。
とはいえ、力不足の研究の問題は現実的であり、引用はおおむね正しいと思いますが、その文言は少し不正確です。
能力不足の研究の基本的な問題は、仮説検定の誤検知率(タイプIエラー)は固定されているが、真の検知率(パワー)が低下することです。したがって、肯定的な(=有意な)結果は、力不足の研究では真の肯定的である可能性は低くなります。この考えは、誤発見率[2]で表されます。[3]も参照してください。これは引用が指すものと思われます。
能力不足の研究に関してしばしば命名される追加の問題は、それらが過大評価された効果の大きさにつながることです。その理由は、a)パワーが低い場合、真の効果の推定値は真の値の周りでより変動(確率的)になり、b)パワーが低い場合、これらの効果の中で最も強いもののみが有意フィルターを通過するためです。ただし、これは重大な影響だけでなく、すべてを議論して報告することで簡単に修正できる報告の問題であると付け加えてください。
最後に、能力不足の研究に関する重要な実用的問題は、低電力により統計的問題(推定量の偏りなど)が増加するだけでなく、変数や同様のPハッキング戦術をいじる誘惑が増えることです。これらの「研究者の自由度」を使用することは、電力が低いときに最も効果的であり、これは結局タイプIエラーを増加させる可能性があります。たとえば、[4]を参照してください。
したがって、これらすべての理由から、私は力不足の研究については本当に懐疑的です。
[1] K. Friston(2012)非統計的レビューア向けの10の皮肉なルール。NeuroImage、61、1300-1310。
[2] https://en.wikipedia.org/wiki/False_discovery_rate
[3]ボタン、KS。ヨアニディス、JPA; モクリズ、C .; ノセック、BA; フリント、J .; Robinson、ESJ&Munafo、MR(2013)停電:小さいサンプルサイズが神経科学の信頼性を損なう理由。Nat。Rev. Neurosci。、14、365-376
[4]シモンズ、JP; Nelson、LD&Simonsohn、U.(2011)偽陽性心理学:データ収集と分析の非公開の柔軟性により、あらゆるものを重要なものとして提示できます。Psychol Sci。、22、1359-1366。