帰無仮説の有意性検定に対する引数を含む参照?


63

ここ数年、私は科学における帰無仮説の有意性検定の使用に反対する多くの論文を読みましたが、永続的なリストを維持するとは考えていませんでした。最近、同僚がそのようなリストを求めてきたので、私はここにいるすべての人にリストの作成を手伝ってもらおうと思った。物事を始めるために、ここに私がこれまで持っているものがあります:


4
100%関連しているわけではないので、回答として投稿していません。しかし、JPA Ioannidis、公表された研究結果のほとんどが誤っている理由PLoS Med 2(8):e124、2005。
枢機

1
経済学者の間で有名な本は、Ziliak、Stephen T.、およびDeirdre Nansen Mccloskeyです。統計的有意性のカルト:標準誤差が私たちに仕事、正義、そして命をどれほど犠牲にするか。ミシガン大学出版局、2008年
ウォルデマー14年

1
ここでの目的は何ですか?
アクサカル

2016年3月、ASAは公式の「p値に関するステートメント」を発行しました。
ケニーLJ

1
多くの言及のは(コメントを含む)このページに記載されています:lesswrong.com/lw/g13/against_nhstを。ここGlen_bの答えで複数の参照:stats.stackexchange.com/questions/142533
アメーバは、モニカーを復活させる

回答:


42

クリス・フレーリーは、議論の歴史に関するコース全体を教えまし(リンクはまだ公式サイトにあるにもかかわらず、壊れているようです。インターネットアーカイブのコピーをご覧ください)。彼の要約/結論はここにあります(再び、アーカイブされたコピー)。Fraleyのホームページによると、このコースを最後に教えたのは2003年でした。

彼はこのリストの前に「インストラクターのバイアス」を付けています。

私の目標は、当面の問題について活発で、深く、公正な議論を促進することですが、最初から自分の偏見を明確にする必要があると思います。ポール・ミールはかつて「ロナルドir(フィッシャー)は私たちを惑わし、魅了し、プリムローズの道に導いてくれました。ソフトにおける実質的な理論を裏付ける標準的な方法として、単に帰無仮説に反論することにほぼ普遍的に依存していると思います」領域はひどい間違いであり、基本的には不健全で、不十分な科学戦略であり、心理学の歴史の中で最悪の事態の1つです。」ミールの感情を反映します。このセミナーでの私の目標の1つは、なぜそうなのかを明確にすることです。さらに、このセミナーを完了するまでに、

コースページが消えた場合に備えて、リーディングリストにコピーします。

第1週はじめに:帰無仮説有意性検定とは何ですか?事実、神話、科学の現状

  • ライケン、DL(1991)。心理学の何が問題になっていますか?D. Cicchetti&WM Grove(eds。)で、心理学について明確に考える、vol。1:公益事項、ポールE.ミールに敬意を表したエッセイ(pp。3 – 39)。ミネソタ州ミネアポリス:ミネソタ大学出版局。

第2週。NHSTの初期の批判

  • Meehl、PE(1967)。心理学と物理学における理論テスト:方法論的なパラドックス。科学哲学、34、103-115。

  • Meehl、PE(1978)。理論的リスクと表形式のアスタリスク:カールir、ロナルドir、およびソフト心理学のゆっくりした進歩。Journal of Consulting and Clinical Psychology、46、806-834。

  • ロゼブーム、WW(1960)。帰無仮説の有意性検定の誤り。Psychological Bulletin、57、416-428。

  • バカン、D。(1966)。心理学的研究における重要性のテスト。Psychological Bulletin、66、423-437。[オプション]

第3週。NHSTの現代的批判

  • コーエン、J。(1994)。地球は丸い(p <.05)。アメリカの心理学者、49、997-1003。

  • Gigerenzer、G.(1993)。統計的推論における超自我、自我、およびID。G. Keren&C. Lewis(編)で、行動科学のデータ分析ハンドブック:方法論的問題(pp。311-339)。ニュージャージー州ヒルズデール:ローレンス・エルバウム・アソシエイツ。

  • Schmidt、FL&Hunter、JE(1997)。研究データの分析における有意性テストの中止に対する8つの一般的だが誤った異議。リサ・A・ハーロー、スタンリー・A・ムライク、ジェームズ・H・シュタイガー(編)では、有意性テストがなかったらどうなるでしょうか?(pp。37-64)。ニュージャージー州マーワー:ローレンス・エルバウム・アソシエイツ。

  • オークス、M。(1986)。統計的推論:社会科学および行動科学の解説。ニューヨーク:ワイリー。(第2章[有意性テストの批判])[オプション]

第4週反論:NHSTの擁護者が防衛に来た

  • フリック、RW(1996)。帰無仮説検定の適切な使用。Psychological Methods、1、379-390。

  • ハーゲン、RL(1997)。帰無仮説統計検定の称賛。アメリカの心理学者、52、15-24。

  • ウィルキンソン、L。、および統計的推論に関するタスクフォース。(1999)。心理学ジャーナルの統計的手法:ガイドラインと説明。アメリカの心理学者、54、594-604。

  • Wainer、H.(1999)。帰無仮説の有意性検定を応援します。Psychological Methods、6、212-213。

  • Mulaik、SA、Raju、NS、およびHarshman、RA(1997)。重要性のテストには時間と場所があります。リサ・A・ハーロー、スタンリー・A・ムライク、ジェームズ・H・シュタイガー、編 有意性テストがなかった場合はどうなりますか?(pp。65-116)。ニュージャージー州マーワー:ローレンス・エルバウム・アソシエイツ。[オプション]

第5週反論:NHSTの擁護者が防衛に来る

  • アベルソン、RP(1997)。むちで打たれた馬の驚くべき長寿について:有意性テストのケースがある理由。心理学、8、12-15。

  • クルーガー、J。(2001)。帰無仮説の有意性検定:欠陥のある方法の存続について。アメリカの心理学者、56、16-26。

  • Scarr、S.(1997)。証拠の規則:統計的議論のより大きな文脈。心理学、8、16-17。

  • Greenwald、AG、Gonzalez、R.、Harris、RJ、およびGuthrie、D.(1996)。効果のサイズとp値:何を報告し、何を複製する必要がありますか?精神生理学、33、175-183。

  • ニッカーソン、RS(2000)。帰無仮説の有意性検定:古くて継続的な論争のレビュー。Psychological Methods、5、241-301。[オプション]

  • ハリス、RJ(1997)。有意性テストには代わりがあります。心理学、8、8-11。[オプション]

第6週。エフェクトサイズ

  • ローゼンタール、R。(1984)。社会調査のためのメタ分析手順。ビバリーヒルズ、CA:セージ。[Ch。2、研究結果の定義]

  • チョウ、SL(1988)。有意性テストまたは効果サイズ?Psychological Bulletin、103、105-110。

  • アベルソン、RP(1985)。分散の説明のパラドックス:少しが多い場合。Psychological Bulletin、97、129-133。[オプション]

第7週。統計的検出力

  • Hallahan、M.&&Rosenthal、R.(1996)。統計力:概念、手順、およびアプリケーション。行動研究と療法、34、489-499。

  • Sedlmeier、P.、&Gigerenzer、G.(1989)。統計的検出力の研究は、研究の検出力に影響を及ぼしますか?Psychological Bulletin、105、309-316。

  • コーエン、J。(1962)。異常社会心理学研究の統計力:レビュー。Journal of Abnormal and Social Psychology、65、145-153。[オプション]

  • マドック、JE、ロッシ、JS(2001)。3つの健康心理学関連のジャーナルに掲載された記事の統計力。健康心理学、20、76-78。[オプション]

  • Thomas、L.&Juanes、F.(1996)。統計的検出力分析の重要性:動物の行動からの例。動物の行動、52、856-859。[オプション]

  • ロッシ、JS(1990)。心理学的研究の統計力:20年で何が得られましたか?Journal of Consulting and Clinical Psychology、58、646-656。[オプション]

  • テューキー、JW(1969)。データの分析:神聖化または探偵作業?アメリカの心理学者、24、83-91。[オプション]

第8週。信頼区間と有意性テスト

  • ガードナー、MJ、およびDGアルトマン。1986. P値ではなく信頼区間:仮説検定ではなく推定。British Medical Journal、292、746-750。

  • カミング、G。、&フィンチ、S。(2001)。中央および非中央分布に基づく信頼区間の理解、使用、および計算に関する入門書。教育および心理測定、61、532-574。

  • ロフタス、GR、およびマッソン、MEJ(1994)。被験者内設計で信頼区間を使用します。Psychonomic Bulletin and Review、1、476-490。

第9週[注:このセクションはスキップします]。理論モデリング:自然現象の形式モデルの開発

  • ヘフナー、JW(1996)。生物学的システムのモデリング:原理と応用。ニューヨーク:国際トムソン出版。(第1章[システムのモデル]&2 [モデリングプロセス])

  • レーリン、JC(1992)。潜在変数モデル:因子分析、経路分析、および構造分析の紹介。ニュージャージー州ヒルズデール:ローレンス・エルバウム・アソシエイツ。(第1章[因子分析、経路分析、構造分析の経路モデル]、1-18ページ]

  • グラント、DA(1962)。帰無仮説と理論モデルを調査する戦略のテスト。Psychological Review、69、54〜61。[オプション]

  • バインダー、A。(1963)。帰無仮説および理論モデルを調査するための戦略と戦術のテストに関するさらなる考慮事項。Psychological Review、70、107-115。[オプション]

  • エドワーズ、W。(1965)。科学的仮説と統計的仮説との関係に関する戦術的なメモ。Psychological Bulletin、63、400-402。[オプション]

第10週。確率の意味は何ですか?相対頻度と主観的確率に関する論争

  • Salsburg、D.(2001)。お茶を味わう女性:20世紀の統計はどのように科学に革命をもたらしましたか。ニューヨーク:WHフリーマン。(第10、11、12章)

  • オークス、M。(1986)。統計的推論:社会科学および行動科学の解説。ニューヨーク:ワイリー。(4、5、6章)

  • Pruzek、RM(1997)。ベイジアン推論とその応用の紹介。リサ・A・ハーロー、スタンリー・A・ムライク、ジェームズ・H・シュタイガー、編 有意性テストがなかった場合はどうなりますか?(pp。287-318)。ニュージャージー州マーワー:ローレンス・エルバウム・アソシエイツ。

  • Rindskoph、DM(1997)。「nullではない」「小さい」仮説のテスト:古典的アプローチとベイジアンアプローチ。リサ・A・ハーロー、スタンリー・A・ムライク、ジェームズ・H・シュタイガー(Eds)。有意性テストがなかった場合はどうなりますか?(pp。319-332)。ニュージャージー州マーワー:ローレンス・エルバウム・アソシエイツ。

  • エドワーズ、W。、リンドマン、H。、サベージ、LJ(1963)。心理学的研究のためのベイジアン統計的推論。Psychological Review、70、193-242。[オプション]

週11.理論評価:科学の哲学と理論の検証と修正

  • Meehl、PE(1990)。理論の評価と修正:ラカトシアンの防衛戦略とそれを保証する2つの原則。Psychological Inquiry、1、108-141。

  • ロバーツ、S。&パシュラー、H。(2000)。どの程度説得力がありますか?理論テストに関するコメント。Psychological Review、107、358-367。

週12.理論評価:科学の哲学と理論の検証と修正

  • Urbach、P.(1974)。「IQ討論」の進行と退化(I)。英国科学哲学誌、25、99-125。

  • Serlin、RC&Lapsley、DK(1985)。心理学的研究における合理性:十分な原則。アメリカの心理学者、40、73-83。

  • Dar、R.(1987)。Meehl、Lakatos、および心理学者の科学的実践の別の見方。アメリカの心理学者、42、145-151。

  • Gholson、B.&Barker、P.(1985)。Kuhn、Lakatos、およびLaudan:物理学および心理学の歴史における応用。アメリカの心理学者、40、755-769。[オプション]

  • Faust、D.&&Meehl、PE(1992)。科学の方法を使用して、科学の歴史と哲学の疑問を解決する:いくつかの図解。行動療法、23、195-211。[オプション]

  • Urbach、P.(1974)。「IQ討論」の進行と退行(II)。英国科学哲学ジャーナル、25、235〜259。[オプション]

  • サーモン、WC(1973年5月)。確認。Scientific American、228、75-83。[オプション]

  • Meehl、PE(1993)。科学の哲学:助けになるか、それとも妨げになるか Psychological Reports、72、707-733。[オプション]マニカ。PT、&Secord、PF(1983)。科学の新しい哲学の心理学への影響。アメリカの心理学者、38、399-413。[オプション]

第13週NHSTの伝統は、偏見のない、心理学の累積知識ベースを弱体化させましたか?

  • クーパー、H。、デネーブ、K。、およびチャールトン、K。(1997)。欠けている科学の発見:人間被験者委員会によるレビューのために提出された研究の運命。Psychological Methods、2、447-452。

  • フロリダ州シュミット(1996)。心理学における統計的有意性テストと累積知識:研究者のトレーニングへの影響。心理学的方法、1、115-129。

  • Greenwald、AG(1975)。帰無仮説に対する偏見の結果。Psychological Bulletin、82、1-20。

  • バーガー、JO&ベリー、DA(1988)。統計分析と客観性の錯覚。アメリカの科学者、76、159-165。

週14.レプリケーションと科学的完全性

  • ノースカロライナ州スミス(1970)。複製研究:心理学研究の無視された側面。アメリカの心理学者、25、970-975。

  • ソーンD.(1998)。統計的有意性と複製可能性:前者が後者を予見しない理由。理論と心理学、8、291-311。

  • Meehl、PE(1990)。心理学理論の研究の要約がしばしば解釈できない理由。Psychological Reports、66、195-244。

  • プラット、JR(1964)。強い推論。Science、146、347-353。

  • ファインマン、RL(1997)。確かに冗談だよ、ファインマンさん!ニューヨーク:WWノートン。(章:貨物カルト科学)。

  • Rorer、LG(1991)。心理学における科学の神話。D. Cicchetti&WM Grove(eds。)で、心理学について明確に考える、vol。1:公益事項、ポールE.ミールを称えるエッセイ(pp。61 – 87)。ミネソタ州ミネアポリス:ミネソタ大学出版局。[オプション]

  • リンジー、RM&エーレンバーグ、ASC(1993)。複製された研究の設計。アメリカの統計学者、47、217-228。[オプション]

第15週定量的思考:心理科学で数学が必要な理由(NHST自体は不要)

  • Aiken、LS、West、SG、Sechrest、L。、およびReno、RR(1990)。心理学の統計、方法論、および測定の大学院トレーニング:博士号の調査 北米のプログラム。アメリカの心理学者、45、721-734。

  • Meehl、PE(1998年5月)。定量的思考の力。ワシントンDCのアメリカ心理学会の年次総会でジェームズ・マッキーン・キャッテル賞の受賞者として招待された住所。


5
+1。リーディングの始まりと終わりがミールであるというのは興味深いです。
whuber

2
これを共有する上で実際のサービスを実行しました。
rolando2

2
コースと概要へのリンクが壊れているようです。あなたはアーカイブプロジェクトを通じて情報を見つけることができます。web.archive.org/web/20151023151618/http://www.uic.edu/classes/...
AG


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.