統計情報のオンラインコースのイントロの一部である、統計的推論(「比率と平均の比較」)に関する講義を見ました。この素材は、いつものように私にはほとんど意味がありませんでした(今までに、このようなものを何十回も見たに違いありません。過去30年間に広がっていました)。
私は懐疑的な読者を納得させるという問題を真剣に受けとめる「基本的な統計-101」(ポイント推定、推定評価、統計的推論、仮説検定、研究デザイン)に関する本を探しています...
以下に、私が探している著者が真剣に受け止め、説得力を持って対処する方法を知っているタイプの質問の例をいくつか示します。
しかし、最初に、この投稿ではこれらの質問をしているわけではない ことを強調します。答えないでください! 私はそれらを単なる例として、「リトマス試験」(検索する著者のタイプ)として提供します。
「割合」がブール変数(つまり、値0と1のみをとる変数)の単純な平均である場合、「割合」と「手段」で統計的推論を行うための異なる手順が教えられるのはなぜですか。
正規分布が非常に堅牢で、そのデータが完全に正規分布していない場合でも正規性を仮定すると良い結果が得られる場合、およびt分布が非常に正規に見える場合、なぜt分布の代わりに正常?
「自由度」とは正確に何であり、なぜそれらを心配するのですか?
データに似ているように見える分布を使用していることを考慮して、パラメーターの「真の」値とはどういう意味ですか?
どうして「探索的データ分析」は良いことなのに、「データスヌーピング」は悪いことなのでしょうか?
私が言ったように、私はそのような質問の怠慢によって暗示されている態度に先送りされています。私に何かを教えている人に見たいのは「認識論的スタンス」ではありません。私は、読者の懐疑論と合理性を尊重し、それらに対処する方法を知っている(必ずしもページと形式主義と技術のページに行くことなく)著者を探しています。
これは非常に難しいことであり、統計に関しては特にそうだと思います。したがって、多くの著者がそれに成功するとは思わない。しかし、現時点では、1つだけを見つけることに満足しています。
私が数学嫌いではないことを付け加えましょう。それどころか、数学が大好きです。(私は分析[別名「高度な計算」)、線形代数、確率理論、さらには基本測度理論に満足しています。)
とはいえ、現時点での私の関心は、「応用」、「実用的」、「毎日」、「現実世界」の統計(理論的な微妙さとは対照的)にあります。(しかし、私も料理本は必要ありません!)
FWIW、私は回帰とゲルマンとヒルによるマルチレベル/階層モデルを使用したデータ分析の最初のいくつかの章を読みました、そして、著者の口調が好きです。彼らの焦点は実用的ですが、必要に応じて理論に入ります。彼らはまた、しばしば後退し、標準的な実践を批判的に評価し、懐疑的な読者の常識に訴える率直な意見を提供します。残念ながら、これらの著者は、この投稿で私が質問している主題(上記の「Stats 101」など)に専念した本を書いていません。また、これらの著者の1人(Gelman)が非常に尊敬されているベイジアンデータ分析を共著していることも知っていますが、これも現時点で私が探しているものではありません。
編集:
Dikran Marsupialは次の異議を提起します。
質問を無視することには必ずしも悪いことはないと思います。すべての質問に対処することは、多くの場合より重要な基本概念の説明を損なう点になります(特に統計101の本で!)。
私はそれに同意します。「基本的な統計の再確認」を探していると言った方が正確です。実際、これを私のモチベーションとして、推論に関する大学院課程で使用されている教科書(例)を見て、リストしたような質問を無視しすぎていることがわかりました。どちらかといえば、彼らはそのような質問を掘り下げる傾向がさらに少ないように見えました(したがって、彼らはいくつかの収束、またはこれ、またはその他の条件のような問題に集中することができます...)。
問題は、より高度な本が根本的に異なる読者集団に向けられていることであり、その読者は「部外者の懐疑論」が劇的に枯渇している。IOW、大学院レベルの統計を取っている人は、私を悩ませる質問に悩まされるポイントを過ぎています。彼らはもはやこのようなものについて懐疑的ではありません。(彼らはどのように懐疑的なこぶを乗り越えたのでしょうか?おそらく彼らがかなり早い段階で統計を学んだ場合は、そもそもそれほど批判的ではなかったのかもしれません。教科書が足りないところを埋めてくれる教師がいた人もいれば、そうした質問に対する答えを自分で理解できるほど賢い人もいたかもしれません。