タグ付けされた質問 「teaching」

あらゆるレベルでの確率と統計の教えについての質問。

8
最初にベイジアン統計または頻度統計を教える必要がありますか?
私は現在高校生で、統計を理解している少年たちを助けています。そして、理論を垣間見ることなく、いくつかの簡単な例から始めることを考えています。 私の目標は、統計をさらに追求し、定量的学習に興味を持たせるために、統計をゼロから学習するための最も直感的でありながら建設的なアプローチを提供することです。 ただし、始める前に、非常に一般的な意味を持つ特定の質問があります。 ベイジアンまたは頻度主義のフレームワークを使用して統計を教え始める必要がありますか? よく調べてみると、一般的なアプローチは、頻繁な統計の簡単な紹介から始まり、その後にベイジアン統計の詳細な議論が続きます(例:Stangl)。

12
把握するのが最も難しい統計的概念は何ですか?
これはここの質問と似たような質問ですが、十分に異なっているので、質問する価値があると思います。 スターターにしたいと思ったのは、最も把握しにくいと思うことです。 私は確率と頻度の差です。1つは「現実の知識」(確率)のレベルにあり、もう1つは「現実そのもの」(頻度)のレベルにあります。これについて考えすぎると、ほとんどいつも混乱します。 エドウィン・ジェーンズは、これらの事柄を混同することを説明するために、「マインドプロジェクションの誤 "」と呼ばれる用語を作成しました。 他に把握するのが難しい概念についての考えはありますか?
32 teaching 


5
サンプリング分布を教えるための戦略
tl; drバージョン 入門的な学部レベルで(たとえばサンプル平均の)サンプリング分布を教えるためにどのような成功した戦略を採用していますか? 背景 9月に、David Moore によるThe Basic Practice of Statisticsを使用して、2年目の社会科学(主に政治学と社会学)の学生向けに統計の入門コースを教えます。私がこのコースを教えたのは5回目であり、私が一貫していた1つの問題は、学生がサンプリング分布の概念に本当に苦労したということです。それは推論の背景としてカバーされており、最初のしゃっくりの後、彼らが問題を抱えていないように見える確率の基本的な紹介に従っています(そして、基本的に、私は基本的なことを意味します-結局のところ、これらの学生の多くは、「数学」のあいまいなヒントでさえも避けようとしたため、特定のコースストリームに自己選択されています。おそらく60%が最低限の理解しか得られずにコースを去り、約25%が原則を理解するが他の概念との関係は理解せず、残りの15%は完全に理解すると思います。 主な問題 学生が抱えていると思われる問題は、アプリケーションにあります。正確な問題が何であるかを説明することは、彼らが単にそれを理解していないと言うこと以外は難しい。前学期に実施したアンケートと試験の回答から、難しさの一部は、2つの関連する類似した発音フレーズ(サンプリング分布とサンプル分布)の混同であると思うので、「サンプル分布」というフレーズは使用しませんもう、しかしこれは確かに、最初は混乱しますが、少しの努力で簡単に把握でき、とにかくサンプリング分布の概念の一般的な混乱を説明することはできません。 (私はそれがあるかもしれないことを認識し、私、私は以来、不快な可能性が行うことが妥当であることを無視して考えるしかし!そしてここでの問題であります私の教え一部の学生がそれと全体的な誰もが非常によくやっているようだ得るように見えるん...) 私が試したこと 私は、学部の学部管理者と議論し、コンピューターラボで必須のセッションを導入し、繰り返しデモを行うことが役立つと考えました(このコースを教える前に、コンピューティングは関係していませんでした)。これは一般的に教材全体を理解するのに役立つと思いますが、この特定のトピックに役立つとは思いません。 私が持っていた一つのアイデアは、いくつかの(例えばによって提唱位置だけですべてでそれを教えないようにするか、それを多くの重量を与えないことであるアンドリュー・ゲルマンを)。最も一般的な分母に教える気配があり、より重要なことは、サンプリングの分布だけでなく、重要な概念がどのように機能するかを本当に理解することから統計的応用についてもっと学びたいと強くてやる気のある学生を拒否するためです。 )。一方、中央値の学生は、たとえばp値を把握しているように見えるため、サンプリング分布を理解する必要はないかもしれません。 質問 サンプリング分布を教えるためにどのような戦略を採用していますか?私は(たとえば、利用可能な材料との議論がある知っているこことここと開き、この論文PDFファイルが)が、私は人々のためにどのような作品のいくつかの具体的な例を得ることができる場合、私はただ思ったんだけど(または私は仕事がなくても、どうなったと思います試さないでください!)。私の今の計画は、9月のコースを計画するとき、ゲルマンのアドバイスに従い、サンプリング分布を「強調しない」ことです。教えますが、これは一種のFYIのみのトピックであり、試験には表示されないことを生徒に保証します(おそらくボーナス質問として!?)。しかし、私は人々が使用している他のアプローチを聞くことに本当に興味があります。

4
自習vs教えられた教育?
Programmers.SEにも同様の意図を持つ質問があります。その質問にはかなり良い答えがありますが、一般的なテーマは自習なしではどこにも行かないということです。 プログラミングと統計の間には明らかに大きな違いがあります-プログラミングでは、基本的なロジックを学習し、繰り返し適用するだけです。新しい言語はすべて同じ基本概念を使用しています。自己学習により、より高度な概念を学び、より効率的になります。この種のものは教えるのが非常に難しいです。 統計はまったく異なります。関係するロジックを適用するのは簡単です-通常、他の誰かが方法論をレイアウトしているからです。実際、方法論は通常、大学で教えられているもののほとんどです。しかし、統計はそれよりもはるかに深く、いくつかの非常に高度な概念を伴います。あなたが教えられているのが統計を適用することだけであり、それらを理解することはおろか、それらの概念を探すことさえ難しいです(これはフィールドの専門用語によるものかもしれませんが)。また、プログラミングの自己学習には、新しい概念を紹介するために多くの短い記事/ブログを読む必要がありますが、統計に関するアクセス可能な記事はほとんどの場合初心者向けであり、したがって、私自身。 質問は次のとおりです。統計については、自習は大学教育よりも多かれ少なかれ適切ですか?自己学習の方法論はありますか?以前に人々のために働いたことの例は歓迎されます。 (これはおそらくコミュニティwikiであるべきですが、チェックボックスは表示されません)

2
さまざまな条件下での2つの数値変数間の関連性をグラフ化するためのヒントを含む優れたオンラインリソース
コンテキスト: その間、2つの数値変数間の関連を効果的にプロットする方法に関する一連のヒューリスティックを取得しました。データを扱うほとんどの人が同様のルールを持っていると思います。 このようなルールの例は次のとおりです。 変数の1つが正に歪んでいる場合、その軸を対数目盛でプロットすることを検討してください。 多数のデータポイントがある場合(たとえば、n> 1000)、何らかの形式の部分透過性の使用やデータのサンプリングなど、別の戦略を採用します。 変数の1つが限られた数の離散カテゴリをとる場合、ジッターまたはヒマワリプロットの使用を検討してください。 3つ以上の変数がある場合、散布図行列の使用を検討してください。 何らかの形のトレンドラインを当てはめることはしばしば有用です。 プロット文字のサイズをサンプルサイズに調整します(nが大きい場合は、より小さいプロット文字を使用します)。 等々。 質問: おそらく例を挙げて、2つの数値変数間の関連性を効果的にプロットするためのこれらおよびその他のトリックを説明するWebページまたはサイトを生徒に紹介できるようにしたいと思います。 インターネット上でこれをうまく機能させるページやサイトはありますか?

2
確率と統計のチートシートを改善するための提案
コンテキスト: 確率論と統計学で出会った中心部分を構築するために、数学的要点に焦点を当てたリファレンスドキュメントを作成しました(こちらから入手できます)。 このドキュメントを共有することで、統計学の学生に、これらのトピックについて大学院コースで教えられているコア資料の包括的な要約を提供したいと考えています。主に教育リソースとして意図されたものですが、人々は個人的な参照としても役立つかもしれません。例えば、一般的なPDFの配布関係やイラストを調べるためです。また、更新プログラムと修正プログラムのページを維持してい ます。フィードバックは常に大歓迎です。 質問: インスピレーションに使用できるお気に入りの統計チートシート、リファレンス、または料理本は何ですか? この分野で知識を構築するのに何が役立ちましたか? 長期的には、私の計画は、理論と実践のギャップを埋めるために、このドキュメントをRの例で充実させる(または別のドキュメントを作成する)ことです。これは価値ある拡張だと思いますか?
22 teaching 

12
負の歪度を持つ分布の実際の例
「一般的な分布の実際の例」に触発されて、負のゆがみを示すために人々がどのような教育例を使用するのだろうか?教育で使用される対称分布または正規分布の「標準的な」例は数多くあります-身長や体重のようなものがより密接な生物学的精査に耐えられない場合でも!血圧は正常に近い可能性があります。私は天文学的な測定誤差が好きです-歴史的に興味深いことですが、それらは直感的にはある方向に他の方向にある可能性は低く、小さな誤差は大きな方向にある可能性が高くなります。 正の歪度の一般的な教育学的例には、人々の収入が含まれます。販売のための中古車の走行距離; 心理学実験における反応時間; 住宅価格; 保険顧客による事故請求の数; 家族の子供の数。それらの物理的妥当性は、しばしば下限値(通常はゼロ)に制限されているために生じます。 ネガティブスキューについては、明確な上限がある現実の分布が少ないため、若い視聴者(高校生)が直感的に把握できる明確で鮮明な例を与えることは困難です。学校で教えられた悪い味の例は「指の数」でした。ほとんどの人は10人ですが、事故で1人以上を失う人もいます。結果は「99%の人が平均以上の指を持っている」ということでした!10は厳密な上限ではないため、多指症は問題を複雑にします。指の紛失と余分な指の両方はまれなイベントであるため、優勢に影響する学生には不明確かもしれません。 通常、高い二項分布を使用します。しかし、学生はしばしば、「バッチ内の不良コンポーネントの数が正に歪んでいる」という補完的な事実よりも「バッチ内の満足できるコンポーネントの数が負に歪んでいる」と感じる。(教科書は産業をテーマにしています。12個入りの箱に入った割れた卵と無傷の卵を好みます。)生徒は「成功」はめったにないと思うかもしれません。ppp 別のオプションは、が正に歪んでいる場合、が負に歪んでいることを指摘することですが、これを実用的なコンテキスト(「負の住宅価格が負に歪んでいる」)に置くことは、教育的失敗の運命にあるように思われることです。データ変換の効果を教えることには利点がありますが、最初に具体的な例を挙げるのが賢明なようです。ネガティブスキューが非常に明確であり、学生の生活経験が分布の形状を認識できるようにする、人工的ではないものを好むでしょう。− XバツバツX− X−バツ-X

3
最初に何を教える必要があります:確率または統計?
私は新しく数学部に教員として参加しました。評判の高い機関の。学部レベルで確率と統計のコースを教えます。施設にはすでにこのコースのシラバスがあり、私はあまり満足していません。そのシラバスでは、統計が最初に扱われ、推定部分も欠落しています。統計を教える前に、確率の基礎を教えるべきだといつも思っていました。誰かがこれについて意見を述べることはできますか?また、そのようなコースでカバーされるべきトピックの提案も大歓迎です。
19 teaching 

6
10代未満で10代の仮説検定を説明する方法は?
1年以上の間、私は1時間の「統計の味」クラスを提供してきました。子どもたちの異なるグループが来るたびに、私は彼らにクラスを与えます。 クラスのテーマは、コカコーラを飲むのが好きな10人の子供にコカコーラとペプシの2つの(マークのない)カップを与える実験を実行することです。子供たちは、味と香りに基づいて、どのカップにコカコーラ飲料が入っているかを検出するように求められます。 次に、子供たちが推測しているのかどうか、または(少なくとも少なくとも十分な)子供たちが違いを味わう能力を本当に持っているかどうかを判断する方法を説明する必要があります。10回の成功のうち10回で十分ですか?10のうち7はどうですか? このクラスを数十回(さまざまなバリエーションで)行った後でも、ほとんどのクラスがそれを取得する方法で概念を理解する方法がわからないと感じています。 仮説検定、帰無仮説、対立仮説、棄却域などの概念を、シンプルな(!)直感的な方法で説明する方法についてアイデアがあれば、その方法を知りたいと思います。


5
応用統計コースで尖度を教えるべきですか?もしそうなら、どのように?
少なくとも直観的には、中心傾向、広がり、歪度はすべて比較的適切に定義できます。これらのものの標準的な数学的尺度も、直感的な概念に比較的よく対応しています。しかし、尖度は異なるようです。それは非常に紛らわしく、分布形状についての直観ともうまく一致しません。 適用された設定での尖度の典型的な説明は、Microsoft Excelを使用したビジネスおよび管理の応用統計 からの次の抜粋です。[ 1 ][1]^{[1]} 尖度とは、分布がどの程度ピークに達するか、逆に分布がどれだけ平坦になるかを指します。正規分布から予想されるものよりも多くのデータ値が裾にある場合、尖度は正です。逆に、正規分布で予想されるよりもテールのデータ値が少ない場合、尖度は負になります。Excelは、少なくとも4つのデータ値がない限り、この統計を計算できません。 「尖度」と「過剰尖度」の混同は別として(この本のように、他の著者が後者と呼ぶものを指すために前者の単語を使用するのが一般的です)、「ピークネス」または「フラットネス」に関する解釈その後、テールにあるデータ項目の数への注意の切り替えによって混乱します。「ピーク」と「テール」の両方を考慮する必要があります—カプランスキー[ 2 ][2]^{[2]}1945年に、当時の多くの教科書では、尖度は、テールを考慮せずに、分布のピークが正規分布のピークと比較してどれだけ高いかについて誤っていると述べていました。しかし、ピークとテールの両方の形状を明確に考慮する必要があるため、直感を把握するのが難しくなります。上記の抽出物は、これらの概念が同じであるかのようにテールのピークからヘビーに分離することでスキップします。 さらに、この古典的な尖度の「ピークとテール」の説明は、対称分布と単峰分布でのみうまく機能します(実際、そのテキストに示されている例はすべて対称です)。それでも、尖度を「ピーク」、「尾」、または「肩」のいずれで表現するかにかかわらず、尖度を解釈する「正しい」一般的な方法は、数十年間議論されてきました。[ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ][2][3][4][5][6]^{[2][3][4][5][6]} より厳密なアプローチが取られたときに矛盾や反例にぶつからない適用された設定で尖度を教える直感的な方法はありますか?尖度は、数学統計クラスとは対照的に、これらの種類の応用データ分析コースのコンテキストではまったく有用な概念ですらありますか?分布の「ピークネス」が直感的に役立つ概念である場合、代わりにLモーメントを使用してそれを教える必要がありますか?[ 7 ][7]^{[7]} [ 1 ][1][1] Herkenhoff、L.およびFogli、J.(2013)。Microsoft Excelを使用したビジネスおよび管理に適用される統計。ニューヨーク、NY:スプリンガー。 [ 2 ][2][2]カプランスキー、I。(1945)。「尖度に関する一般的なエラー」。 Journal of the American Statistics Association、40(230):259。 [ 3 ][3][3]ダーリントン、リチャードB(1970)。「尖度は本当に「ピーク」ですか?」アメリカ統計 24(2):19–22 [ 4 ][4][4] Moors、JJA。(1986)「尖度の意味:ダーリントンが再検討された」。アメリカの統計学者 …

8
統計に関する優れた学部入門教科書の提案はありますか?
いくつかの提案をいただければ幸いです。私は非常に多様な(少数グループで作られた)大学で教えており、学生はほとんど心理学専攻です。ほとんどの生徒は高校からの新入生ですが、一部の生徒は40歳以上の高齢の帰国生徒です。ほとんどの生徒は動機付けの問題と数学への嫌悪感を持っています。しかし、私はまだ基​​本的なカリキュラムをカバーする本を探しています。説明からサンプリング、テスト、ANOVAまで、そしてすべて実験的方法の文脈で。部門では、クラスでSPSSを使用する必要がありますが、Excelなどのスプレッドシートで分析を構築するというアイデアが気に入っています。 ps他の教師は、計算式に大きく依存しているために私が好きではない本を使用しています。合理的で基本的なアルゴリズムと一致する、より直感的で計算集約的な式ではなく、これらの計算式を使用すると、直感的で不要で混乱します。これは、私が行動科学の統計の要点、第7版ニューヨークのフレデリックJグラベッター州立大学、ブロックポートラリーB.ウォールナウ州立大学ニューヨーク校、ブロックポートISBN-10:049581220Xを参照する本です。

2
標準偏差がNの平方和のsqrtとしてではなく、分散のsqrtとして定義されるのはなぜですか?
今日、私は統計の入門クラスを教え、学生が質問を思いついた。ここで、「なぜ標準偏差はN上の平方和の平方ではなく分散の平方として定義されるのか」と言い換える。 母分散を定義します:σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} 標準偏差:。σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 与えられる解釈は、母平均から母集団の単位の平均偏差を与えるということです。σσ\sigmaXXX ただし、sdの定義では、平方和のを除算します。学生が提起する問題は、なぜ二乗和の面積をで割らないのかということです。したがって、競合する式になります:学生は、この式はように除算する場合よりも、平均からの「平均」偏差のように見えると主張しました。N−−√N\sqrt{N}NNNσnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.N−−√N\sqrt{N}σσ\sigma この質問は愚かではないと思いました。私は、sdが平均平方偏差である分散のsqrtとして定義されていると言うよりも先に進む学生に答えたいと思います。別の言い方をすれば、なぜ生徒は正しい式を使用し、自分の考えに従わないのですか? この質問は、ここで提供される古いスレッドと回答に関連しています。答えは3つの方向にあります。 σσ\sigmaは二乗平均平方根(RMS)偏差であり、平均からの「典型的な」偏差ではありません(つまり、)。したがって、定義が異なります。σnewσnew\sigma_{new} 数学的な特性があります。 さらに、sqrtは「ユニット」を元のスケールに戻します。ただし、これは場合でもあり、代わりにで除算されます。σnewσnew\sigma_{new}NNN ポイント1と2の両方は、RMSとしてsdを支持する引数ですが、使用に反対する引数はません。入門レベルの学生に平均からの平均RMS距離使用を説得する良い議論は何でしょうか?σnewσnew\sigma_{new}σσ\sigma

2
両側検定の説明
私は、生徒に(初等統計学コースで)両側検定とは何か、またそのP値がどのように計算されるかを説明するさまざまな方法を探しています。 両側検定と片側検定を生徒にどのように説明しますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.