最初にベイジアン統計または頻度統計を教える必要がありますか?


32

私は現在高校生で、統計を理解している少年たちを助けています。そして、理論を垣間見ることなく、いくつかの簡単な例から始めることを考えています。

私の目標は、統計をさらに追求し、定量的学習に興味を持たせるために、統計をゼロから学習するための最も直感的でありながら建設的なアプローチを提供することです。

ただし、始める前に、非常に一般的な意味を持つ特定の質問があります。

ベイジアンまたは頻度主義のフレームワークを使用して統計を教え始める必要がありますか?

よく調べてみると、一般的なアプローチは、頻繁な統計の簡単な紹介から始まり、その後にベイジアン統計の詳細な議論が続きます(例:Stangl)。


5
あなたの質問は、文脈がなければ答えることは困難です。達成したいことは何ですか?
Glen_b -Reinstateモニカ

4
子供にベイジアンの統計を教えるのは悪い子育てで、ウォッカを注いだり葉巻に火をつけたりするのに似ています。ウォッカと葉巻は、大人が自分で発見する限り
問題ありません。アクサカル

2
@Aksakal私は実際にウォッカを飲みながらハバナを膨らませながらベイズの定理を教えることを計画していました...
;

2
これは、数年間、子供をベイジアン統計から遠ざける良い方法です。ベイズの定理アプリケーションにすぎないことを伝えます。定理は、頻繁な統計で
正常に機能します。アクサカル

5
ネイトシルバーの本「The Signal and the Noise」は、若者にベイジアン統計を教えるための事例です。
ロイドクリスマス

回答:


25

ベイズ統計と頻度論統計はどちらも確率理論に基づいていますが、前者は最初から理論に大きく依存していると思います。一方、学生が確率の概念を十分に理解すれば、信頼区間の概念は信頼区間の概念よりも直感的です。だから、あなたが選ぶものは何でも、私はまずサイコロ、カード、ルーレット、モンティホールのパラドックスなどに基づくすべての例で、確率の概念の把握を強化することを提唱します。

私は純粋に功利主義的なアプローチに基づいて、どちらかのアプローチを選択します。彼らは学校で頻繁な統計やベイジアン統計を勉強する可能性が高いのでしょうか?私の国では、彼らは間違いなく頻度主義のフレームワークを最初に学びます(そして最後に:高校生がベイジアン統計を教えられたことを聞いたことがない、唯一のチャンスは独学で大学かその後になります)たぶんあなたのそれは違うでしょう。NHST(帰無仮説有意性検定)に対処する必要がある場合、頻度論統計IMOのコンテキストでより自然に発生することに注意してください。もちろん、ベイジアンフレームワークでも仮説をテストすることができますが、フリークエンシーやベイジアンフレームワーク(たとえば、コロンビア大学のAndrew Gelman)のいずれかで、NHSTをまったく使用しないと主張する多くの主要なベイジアン統計学者がいます。

最後に、あなたの国の高校生のレベルについては知りませんが、私の場合、生徒が確率理論と積分の積分を(基本)うまく同化することは本当に難しいでしょう。したがって、ベイジアン統計を使用することにした場合は、連続的なランダム変数のケースを実際に避け、離散ランダム変数に固執します。


2
アンドリュー・ゲルマンは、ベイジアンと同じくらい頻繁にNSHTを支持するだろうという印象を受けていました(彼のブログを読んだことから)。
プサルカ

2
@psarka はい、確かに -私は反対を言ったことはありません。
DeltaIV

3
「私の国では、彼らは間違いなく頻度主義のフレームワークを最初に学ぶだろう」—これは(または、ベイジアン主義の議論を完全に省略する)、世界中の伝統的なアプローチです。
コディオロジスト

1
@Kodiologist私も同じように疑った。少なくとも、高頻度のフレームワークの後に、ベイジアンのフレームワークも高校で導入される教育システムがあるかもしれません。しかし、それはこの辺ではそうではありません。
DeltaIV

22

ベイジアンとフリークエンティストは異なる質問をします。ベイジアンは、観測されたデータから、どのパラメーター値が信頼できるかを尋ねます。頻度の高い人は、いくつかの仮想パラメータ値が真である場合に、仮想のシミュレートされたデータの確率について尋ねます。頻繁な決定は、エラーを制御することによって動機付けられ、ベイジアンの決定は、モデル記述の不確実性によって動機付けられます。

では、最初にどちらを教えるべきですか?さて、これらの質問のいずれかが最初に尋ねたいものである場合、それはあなたの答えです。しかし、親しみやすさと教育学の観点からは、ベイジアンははるかに理解しやすく、はるかに直感的だと思います。ベイジアン分析の基本的な考え方は、シャーロック・ホームズが有名に言ったように、何百万人もの読者が直感的に理解したように、可能性を超えて信頼性を再配分することです。しかし、頻度分析の基本的な考え方は非常に困難です。特定の仮説が真である場合に発生した可能性のあるすべてのデータセットのスペース、および要約よりも極端な要約統計量を持つ架空のデータセットの割合実際に観測された統計。

ベイジアンのアイデアに関する無料の入門章がここにあります。頻繁な概念とベイジアン概念を並べて設定する記事はこちらです。この記事では、仮説検定と推定(およびその他の多くのこと)に対する頻繁なアプローチとベイジアンアプローチについて説明します。この記事のフレームワークは、風景のビューを取得しようとする初心者にとって特に便利です。


章のタイトルと記事を含めると、将来リンクが機能しなくなった場合に役立ちます。
リチャードハーディ

8

この質問は意見に基づくリスクがあるため、私の意見を簡単に説明してから、本の提案をします。それは、特に良い本がとるアプローチだからです。

ベイジアン統計がより直感的であることに同意します。信頼区間と信頼区間の区別は、おおまかにまとめています。人々は、当然、信頼区間のアプローチではなく、「その可能性は...」という観点から考えています。信頼区間のアプローチは、信頼できる区間と同じことを言っているように聞こえますが、「原則の95%」から「95%の確率」までの最後のステップを踏むことはできません。できません。一貫性がなく、直感的でもありません。

バランスを取ることは、彼らが受講するほとんどの大学のコースが、直感的ではない頻度の高いアプローチを使用するという事実です。

それは、リチャード・マケルリース著の「統計的再考:Rとスタンの例を含むベイジアン・コース」という本が本当に好きだということです。安くはないので、購入する前に、それについて読んで、Amazonで調べてみてください。これは、ベイジアンのアプローチを活用した非常に直感的なアプローチであり、非常に実践的です。(RとStanはベイジアン統計の優れたツールであり、無料であるため、実践的な学習です。)

編集:いくつかのコメントは、本はおそらく経験豊富な家庭教師でさえ、高校生を超えていると述べています。そのため、さらに大きな注意を払う必要があります。最初は単純なアプローチですが、すぐに増加します。それは素晴らしい本ですが、実際には、Amazonで最初に想定したことや、どれだけ速く起動するかを把握するために、Amazonで実際に調べなければなりません。美しい類似点、Rでの優れた実践的作業、信じられないほどのフローと組織化、しかしあなたには役に立たないかもしれません。

プログラミングとR(無料の統計パッケージ)の基本的な知識と、確率と統計の基本をある程度知っていることを前提としています。それはランダムアクセスではなく、各章は前の章に基づいています。最初は非常にシンプルですが、難易度は途中で上昇しますが、マルチレベル回帰で終わります。そのため、その一部をAmazonでプレビューし、基本を簡単にカバーできるか、それとも少し先に進んでいるかどうかを判断することをお勧めします。

編集2:ここでの私の貢献の最終行であり、純粋な意見からそれを変えようとする試みは、良い教科書があなたがとるアプローチを決定するかもしれないということです。私はベイジアンアプローチを好むだろう、そしてこの本はそれをうまくやっているが、おそらく速すぎるペースで。


2
McElreathの本は素晴らしいが、才能のある家庭教師でさえ、高校生がそのレベルの治療を続けることができたら、私は本当に驚くだろう。
DeltaIV

2
@DeltaIV:良いフィードバック、答えを編集します。冒頭の読みやすさと類推に何度もされてきました。途中で急な学習曲線に入りますが、おそらくそれよりはるかに早いでしょう。
ウェイン

1
もう一つの注意:ファンダメンタルズ(すなわち、確率論)とベイジアン法よりも周波数主義法の適用との間には大きなギャップがあると思います。つまり、MLE理論やCLTの証明などを本当に理解している人を想像するのは難しいです。大学院レベルの教育は、最も基本的な頻度の手続きにも必要です。条件付き確率がわかれば、ベイジアン推論の仕組みを基本的に理解できます。MCMCの理論は少し注意が必要ですが、正直なところ、MLEの理論を真に理解するよりもはるかに単純です...
Cliff AB

...そして、少なくともベイジアンフレームワークの統計の確率と適用の間のギャップを埋めるのが簡単なので、少なくとも、私は物事をより精神的に満足させることが速くなると思います。誰かの科学的好奇心をいくらか殺すか、もっと大きな精神的コミットメントを要求しなければならないと感じたので、私たちが「そして私たちを信頼し、MLE理論は大きなサンプルで機能する」と言わなければならないコースをTAすることを嫌いました。
クリフAB

...しかし、直感 MLEの背後には自然十分...であるstats.stackexchange.com/questions/112451/...
はKjetil BのHalvorsenの

5

私はまず頻度主義的アプローチ、次にベイジアン的アプローチを教えられました。私はプロの統計学者ではありません。

ベイジアンのアプローチを理解する上で、頻繁なアプローチに関する私の予備知識が決定的に役立つとは思わなかったことを認めなければなりません。

次の生徒にどの具体的なアプリケーションを見せるか、そしてどのくらいの時間と労力を費やしているかによって決まります。

これを言って、私はベイズから始めます。


3

ベイジアンフレームワークは、一般的な批判的思考スキルと密接に結びついています。次の状況で必要なものです。

  1. 競争力のある仕事に応募することを考えています。入るチャンスは?申し込みからどのような見返りを期待しますか?
  2. 見出しは、携帯電話が長期的に人間に癌を引き起こすことを伝えています。これについてどの程度の証拠がありますか?
  3. 最大の効果をもたらすには、どの慈善団体にお金を寄付すべきですか?
  4. 誰かが、あなたからの$ 0.90と$ 1.10のベットでコインをフリップすることを申し出ます。彼らにお金をあげますか?なぜですか?
  5. キー(または原子爆弾)を紛失しました。どこから探し始めますか?

また、これは、2サンプルのt検定の式を記憶するよりもはるかに興味深いものです。これにより、学生はますます技術資料に煩わされるほど興味を持ち続ける可能性が高くなります。


3

ベイジアン統計の基礎である尤度については誰も言及していません。ベイズを最初に教えることを支持する議論は、確率から尤度へ、そしてベイズへの流れがかなりシームレスであるということです。ベイズは、(i)尤度関数が確率分布関数のように見える(および作用する)が、曲線下の面積が1.0ではないためではなく、(ii)粗く、一般的に使用されるWald区間は、正規分布に比例する尤度関数を想定していますが、ベイジアン法はこの制限を簡単に克服します。

ベイズを優先するもう1つの議論は、他の人が述べたように、p値に関するP(A | B)対P(B | A)の懸念をより簡単に説明できるということです。

「ベイズファースト」を支持するさらに別の議論は、条件付き確率モデルについて学生がより慎重に考えることを強制することであり、これは他の場所、例えば回帰分析で有用です。

自己宣伝については申し訳ありませんが、完全に話題になっているので、これはまさに「高度な統計的手法の理解」(https:// peterwestfall。 wixsite.com/book-1)対象読者は非統計学者です。


2

楽しさと洞察のために、または実用のために教えていますか?教育と理解が目的であれば、ベイズに行きます。実用的な目的であれば、間違いなくフリークエンティストに行きます。

自然科学の多くの分野、そして私はほとんどの分野で、人々はp値で論文を発表することに慣れています。あなたの「男の子」は、他の人の論文を書く前に他の人の論文を読む必要があります。少なくとも私の分野では、他の人の論文を読むには、ベイジアン研究の後でどれだけ愚かであっても、帰無仮説とp値を理解する必要があります。そして、彼らが最初の論文を発表する準備ができていたとしても、おそらく彼らはチームを率いる上級科学者を持っているでしょう。

そうは言っても、@ Wayneに同意したいと思います。統計の再考は、頻度に関する既存の知識に基づいたものではなく、最初のアプローチとしてベイジアン統計への非常に明確な方法を示しているからです。この本があなたをより良いか悪い統計の戦いであなたを説得しようとしないのは素晴らしいことです。ベイズに関する著者の述べられた議論は、彼が両方の種類を教えてきており、ベイズが教えるのが簡単だったという(IIRC)です。


2

私はベイジアンから離れて、巨人に従う。

ソビエトには中等学校の生徒向けの優れた書籍シリーズがあり、「 'Quant' little library」と大まかに英語に翻訳されています。コルモゴロフは、「確率論入門」というタイトルの共著の本を寄稿しました。英語に翻訳されたことは確かではありませんが、ロシア語のオリジナルへのリンクはこちらです。

彼らは、組み合わせ論を通して確率を説明するアプローチを取っています。これは、開始するのに最適な方法だと思います。本はまともな数学を持つ高校生にとって非常にアクセスしやすいです。ソビエトは数学をかなり広範に教えていたので、平均的な西部の高校生は十分な準備ができていないかもしれないが、十分な関心と力でコンテンツを処理できることに注意してください。

このコンテンツは学生にとって非常に興味深いものです。ランダムウォーク、制限された分布、生存過程、多数の法則などがあります。このアプローチをコンピューターシミュレーションと組み合わせると、さらに楽しくなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.