タグ付けされた質問 「teaching」

あらゆるレベルでの確率と統計の教えについての質問。

2
統計におけるベクトル計算
今学期は、いくつかの変数の関数の統合とベクトル計算についてクラスを教えています。このクラスはほとんどの経済学専攻と工学専攻で構成されており、数学や物理学の専門家もいます。私はこの学期を前学期に教えました、そして、経済学専攻の多くは後半にかなり退屈であることがわかりました。共同で分布した確率変数を使用していくつかの計算を行うことで、複数の積分を動機づけることができましたが、コースのベクトル分析の部分については、物理学に基づいて考えることができる唯一の動機付けでした。 だから、誰かがベクトル計算の主要な定理のいずれかの統計的/確率論的解釈を知っているかどうか疑問に思っています:グリーンの定理、ストークスの定理、そして発散の定理。問題の一部は、発散、勾配、またはカールは言うまでもなく、確率論ではベクトル場があまり頻繁に出現しないように見えることです。数日前にこの質問をmath.stackexchangeにも投稿しましたが、まだ他のアイデアを探しています。

4
次の統計コースのうち、金融/テクノロジー業界で最も適切で有用なものはどれですか?[閉まっている]
休業。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善してみませんか?この投稿を編集して、事実と引用で回答できるように質問を更新してください。 2年前休業。 私は、応用数学コースのクラスターに使用する3つの統計クラスを選択する途中です(保険数理科学または統計分析に集中します)。次の3つのクラスのうち、財務/技術/コンピュータサイエンスとの組み合わせで最も役立つ/適用できると思いますか 確率過程(ランダムウォーク、離散時間マルコフ連鎖、ポアソン過程) 線形モデリング:理論とアプリケーション 時系列の概要 現代の統計予測と機械学習 ゲーム理論 計量経済分析入門(StatsとEconのクロス登録)

1
実験計画の大学院コースは何をカバーすべきですか?
農学と生態学の上級の大学院生のために実験計画のコースを提案するように頼まれました。私はそのようなコースを受講したことがなく、このコースの名前が「Beyond one-way ANOVA」であることがわかり、農業分野の実験に関する統計の上級大学院コースで学んだ教材(例: RCBD、ラテン方陣、コントラスト、反復測定、および共変量)。たぶん、「実験結果の分析」ではなく「実験デザイン」という名前に戸惑っています。 私はそのようなコースに何が含まれるべきかについていくつかのアイデアを持っています、そしてこれが学生のニーズを満たす統計カリキュラムにどのように統合されるかについてのフィードバックをいただければ幸いです。 たとえば、線形および2次関数で回帰モデルを比較するように教えるときに、連続変数の分類を強制するANOVAで線形および2次の対比を使用するように生徒に教えることは想像できません。2番目のケースでは、実験的に定義された離散値ではない要因を処理する方法も学習します。どちらかと言えば、2つのアプローチを比較します。 「実験デザイン」のコースを教えるとしたら、適用する統計モデルに依存せず、他の問題にさらに広く適用される基本的な概念を強調したいと思います。これにより、学生は最新の統計的アプローチをより柔軟に使用できるようになります。 既存のコースでカバーされていないように見える関連概念の一部は次のとおりです。 階層モデルと混合モデル(ANOVAと親族を1つの例として理解しています) モデル比較(コントラストを置き換えるためなど) 「因子」としてブロックの代わりに空間モデルを使用する レプリケーション、ランダム化、およびIID 仮説検定、p-ハッキング、パターン認識の違い。 シミュレーションによる電力分析(たとえば、シミュレーションされたデータセットからのパラメーターの回復)、 事前登録、 発表された研究および科学的原理からの事前知識の使用。 現在そのようなアプローチを取っているコースはありますか?そのような焦点を当てたテキスト本はありますか?

2
このデータをどのように使用して、学生の論文のグレーディングにおいて、さまざまなレベルのマーカーを校正できますか?
12人の教師が600人の生徒を指導しています。これらの教師が教える12のコホートのサイズは40人から90人の学生の範囲であり、大学院生は特定のコホートに偏って割り当てられており、以前の経験では平均スコアの大学院生のスコアが学部生。 教師はコホート内のすべての論文を採点し、100点満点のスコアを割り当てました。 各教師はまた、他の3人の教師からランダムに選択された1つの論文を見て、100点満点でした。このようにして36の異なる論文にクロスマークが付けられました。私はこれを私の校正データと呼びます。 各コホートの大学院生の数もわかります。 私の質問は: A)このキャリブレーションデータを使用して、元のマークを調整して、より公平にすることができますか?特に、過度に寛大/非エネルギーなメーカーの影響をできるだけ洗い流したい。 B)校正データはどの程度適切ですか?このコースで取得したキャリブレーションデータの36の限られたデータポイントの選択肢がなかったため、現在の学期中にこれ以上収集するオプションがありませんでした。ただし、この状況が繰り返し発生する場合は、さらに多くのキャリブレーションデータを収集したり、別の種類のキャリブレーションデータを収集したりできる場合があります。 この質問は、私が尋ねた人気のある質問の相対的なもの です。学生の論文の評価において、寛大さのレベルが異なるマーカーの影響に最もよく対処するにはどうすればよいですか。。しかし、それは別のコースであり、私が校正データを持っていなかったという主な問題があったので、この質問を読むことがこの現在の問題の背景としてどれほど役立つかはわかりません。

6
学部生に示す良い例は何ですか?
今学期後半は、CS志向の大学生に教員補として統計を教えます。ほとんどの学生はクラスを受講し、その主題を学ぶインセンティブはなく、主要な要件のためだけに受講しました。私は、B +を合格させるために学んだクラスだけでなく、主題を面白く有用なものにしたいと考えています。 純粋数学の博士課程の学生として、私は実際の応用面についてはほとんど知りませんでした。学部統計の実際のアプリケーションをいくつかお願いしたいと思います。私が探している例は次のようなものです(精神的に): 1)中心極限定理を示すことは、特定の大きなサンプルデータに役立ちます。 2)中心極限定理が適用できないという反例を示します(たとえば、コーシー分布に従うもの)。 3)Z検定、t検定などを使用して、有名な実例で仮説検定がどのように機能するかを示します。 4)過適合または誤った初期仮説がどのように誤った結果をもたらすかを示す。 5)p値と信頼区間が(よく知られている)実際のケースでどのように機能したか、およびそれらがあまり機能しない場合を示します。 6)同様に、タイプI、タイプIIのエラー、統計的検出力、拒否レベルなど。αα\alpha 私の問題は、確率の側面に多くの例(コイントス、ダイストス、ギャンブラーの破滅、マルチンゲール、ランダムウォーク、3つの囚人のパラドックス、モンティホール問題、アルゴリズム設計における確率法など)がありますが、統計面での多くの標準的な例。私が言いたいのは、教育学的に価値のある深刻で興味深い例であり、実際の生活から非常に切り離されているように見えるほど人工的に作られたものではありません。Z検定とt検定がすべてであるという誤った印象を学生に与えたくありません。しかし、私の純粋な数学の背景のために、クラスを彼らにとって興味深く、有用なものにするのに十分な例を知りません。だから私はいくつかの助けを探しています。 私の学生のレベルは微積分Iと微積分II前後です。彼らはガウスカーネルの評価方法がわからないため、標準法線の分散が定義で1であることを示すこともできません。そのため、少し理論的または実践的な計算(超幾何分布、1Dランダムウォークのアークシンの法則など)は機能しません。「どうして」だけでなく、「なぜ」も理解できる例をいくつか紹介したいと思います。そうでなければ、私が脅迫によって私が言ったことを証明するかどうかはわかりません。

1
L2が事後損失を計算するための優れた損失関数である場合の例は何ですか?
L2損失は、L0およびL1損失とともに、事後を最小事後予測損失で要約するときに使用される非常に一般的な「デフォルト」損失関数の3つです。この理由の1つは、それらが比較的簡単に計算できることです(少なくとも1d分布の場合)。L0は最頻値、L1は中央値、L2は平均値になります。教えるとき、L0とL1が合理的な損失関数である(そして単に「デフォルト」ではない)シナリオを思い付くことができますが、L2が合理的な損失関数であるシナリオに苦労しています。だから私の質問: 教育目的で、L2が最小事後損失を計算するための優れた損失関数である場合の例は何でしょうか? L0の場合、賭けのシナリオを思いつくのは簡単です。今度のサッカーゲームのゴールの合計数に対して事後を計算し、ゴールの数を正しく推測し、それ以外の場合は負けた場合、$$$に勝つ賭けをするとします。その場合、L0は妥当な損失関数です。 私のL1の例は少し不自然です。あなたは多くの空港の1つに到着し、それから車であなたのところへ行く友人に会っています。問題はあなたがどの空港か分からないことです(そして彼女は空中にいるのであなたの友人に電話をかけることができません)。彼女が着陸する可能性のある空港の後方を考えると、彼女が到着したときに彼女とあなたの間の距離が短くなるように自分を配置するのに適した場所はどこですか?ここで、予想されるL1損失を最小化するポイントは、彼女の車が一定の速度であなたの場所に直接移動するという単純な仮定をすると、合理的に思えます。つまり、1時間の待機時間は、30分の待機時間の2倍です。

3
初めての先生への提言(生物統計学入門)
私は今秋、ファーストクラスを教えています(生物統計学の概要)。誰かが統計をよりよく教えるための提案はありますか?たぶん、あなたがあなたの最初の先生が使用したいと思ういくつかの例はありますか?私はPaganoとGauvreauによるPrinciples of Biostatisticsを使用しています。 詳細を編集する このクラスは、週2回1.5時間開催されるオンラインクラスです。学生は、パワーポイント/ビーマープレゼンテーション(退屈ですか?)と小さなタブレット/ペンアクション(エキサイティングですか?)を見ながら講義を聞いてくれます。大学院生(看護、医学生、公衆衛生など) シラバス: 1)生物統計学とは何ですか? 2)確率 3)診断テスト(すなわち、特異性、感度、ROC曲線。主にここでb / cを使用すると、ベイズルールなど、確率で学んだことの一部を適用できます) 4)分布 5)標本分布 6)信頼区間 7)仮説検定(1つのサンプル、2つのサンプル、比率) 8)検出力とサンプルサイズの計算 9)ノンパラメトリック法 10)隣接表(カイ2乗検定、フィッシャー検定、mcnemars検定、相対リスク、オッズ比) 11)相関 主な目的は、学生が統計的推論の中心的な概念を学ぶことです。たとえば、「どの薬が良いですか?」という質問をどのように定量化しますか。そのようなもの。 上記のセクションについて、それらを教えるためのアドバイス/注意の言葉はありますか? たとえば、私はプロポーションの推論を行うときに、学生をワルドテストとスコアテストに紹介するさまざまなアプローチを見たり聞いたりしました。教え方が不十分だと、生徒は混乱しやすくなります(「なぜ2つあるのですか?」、「どちらを使用するのか」、「私には同じように見えます」)。一部の教師はこれらの名前についてさえ言及せず、 :信頼区間に対してこれを行い、仮説検定に対して他のことを行います。この問題や他の問題にどのように取り組みますか?

7
データ視覚化の例、教育、研究用のデータセット
私が研究しているいくつかのdatavis手法をテストするために使用できる既存のデータセットを検索しています。 私はRに含まれているようないくつかのリソースを知っています(試してみるplot(Orange)か、ここを参照してください)。 しかし、私はそれを一歩前進させたいと思います: 視覚化ツールをテストするのに最適な実際のデータセットはどれですか? 学術論文やdatavisに関する教育用スライドで使用したデータセットはどれですか。 グラフ化の利点を示す実例の中で最も良い例はどれですか。

1
高校でのベイズモデルの比較
私は高校生に物理学を教えています。生徒たちに、実験のデータについて初歩的なベイズモデル比較を行ってもらいたいと思います。私は彼らがそうする方法を考え出しました(以下を参照)が、それが正しいかどうかはわかりません。私はそれについてのフィードバック(特に否定的なフィードバック!)、またはそれをより良くする方法についての提案をいただければ幸いです。 勾配aaaと切片パラメーターを持つ線形理論bbbを、定数の帰無仮説、つまり勾配aaa = 0 と比較します。どちらの場合も、ガウス対称ノイズを想定しています。 学生は、Excel、勾配と切片のための最尤推定値(使用して、導き出すことができ、およびBを)、およびそのエラーがdのとD Bを。a^a^\hat{a}b^b^\hat{b}dadadadbdbdb 斜面上の前のため、私は、広いガウス分布を考慮し、最大=尤推定(を中心)とその10倍の標準偏差。私の推論は、現実的には「正しい」ラインパラメータを少なくとも1マグニチュード内に見つけることを期待しており、実際にはより近いものを見つけるため、「正しい」スロープをMLEに置き換えても変更しません数が多すぎます。a^a^\hat{a} いずれかの特定の線形理論与えられた証拠の可能性のために、私は、標準偏差(と、標準の多変量ガウス分布を考慮しての二乗残差和に関連します)。σeσe\sigma_e したがって、一般的に線形理論の証拠の尤度、つまり上記の事前確率と尤度の積分は、MLEポイントでの事前尤度と尤度に勾配誤差を掛けたものと推定されます。dadada 帰無仮説所与の証拠の可能性について(全標準偏差を用いて、他の多変量ガウス分布であると仮定される平均-Yとの差に基づいて、)。σTσT\sigma_T これは、私が確信が持てない部分です。ベイズ係数を上記の2つの尤度(上記の3と4)の比率であると推定します。これにより、次の式を考え出すことができます。 B10= da(10 | a^| ⋅ 2 π√)(σT/ σe)N⋅ E√B10=da(10|a^|⋅2π)(σT/σe)N⋅eB_{10}=\frac{da}{(10 |\hat{a}| \cdot \sqrt{2 \pi})}(\sigma_T/\sigma_e)^N\cdot \sqrt{e} これにより、ベイズ因子の合理的な推定が得られますか?どんなフィードバックでも大歓迎です。

4
中心極限定理の証明
中/高セキュリティの刑務所にいる囚人に基本的な(非常に)統計を教えており、中心極限定理を実証したいと思います。教室にはホワイトボード以外のリソースはありません。紙と筆記用具しか持てません。簡単なデモについて何か提案はありますか?

1
疫学者/公衆衛生の同僚に高度な予測モデリングを穏やかに導入するにはどうすればよいですか?
社会科学と疫学の背景から来た私の同僚は、最小二乗回帰、ロジスティック回帰、および生存分析について訓練を受けました。彼らは、95%の信頼区間とパラメーター係数のp値を確認することを好み、ニューラルネットワーク、CART、バギングとブースティング、ペナルティ付き回帰手法などの現在の予測ツールに不信感を抱いています。

4
なぜすべてのテストが項目分析/応答理論で採点されないのですか?
項目分析/応答理論がより広く適用されない統計的な理由はありますか?たとえば、教師が25問の多肢選択式テストを行い、全員が10問正解した場合、10問は非常に低い割合で回答され(たとえば10%)、残りの5問は約50%の人が回答した。難しい質問にさらに重みを付けるために、スコアの重み付けを変更することは理にかなっていますか? それでも、現実の世界のテストでは、ほとんどの場合、すべての質問に等しく重み付けされています。どうして? 以下のリンクでは、差別の指標と、どの質問を選択するのが難しいかについてのその他の対策について説明しています。http: //fcit.usf.edu/assessment/selected/responsec.html ただし、質問の識別インデックスを計算する方法は、前向きな方法でのみ使用されるようです(たとえば、質問がうまく識別できない場合は、それを投げます)。現在の母集団に対してテストの重み付けが変更されないのはなぜですか?

1
スコア関数と漁師の情報を生徒に説明する(直感/例を提供する)
来週は、スコア関数とその分散(つまり、漁師情報)を生徒に教えます。 私は、これらの概念を説明し、生徒が理解できるようにする方法を探しています(クラスでよく行われているさまざまな分布についてそれらを計算するだけではありません)。 どんな提案も役に立ちます(スコア関数の背後にある直感とは何か、および尤度スコア関数101へのリンクを提供する以外に)

1
なぜ中心傾向の測定から始めるのですか?
で教え記述統計を、中心傾向の尺度は、例えばスプレッドの対策前に、早い段階で出てきます。私にとっては、他の多くの特性を学ぶ前に、データの中心的な傾向、つまり場所について学ぶことは十分に自然ですが、これは私が教えられた方法に由来しているだけかもしれません。 しかし、なぜ中心的傾向が最初に学ぶべきであるかについて、良い動機はありますか? 特定の中心傾向(平均、中央値、最頻値など)にデータに関するほとんどの情報が含まれているとは言えません。また、最も重要な情報が含まれているとは言えません(相対的な重要性は実際にデータの使用目的に依存するため)。 しかし、代わりに何が言えるでしょうか?

1
「ローディング」と呼ばれる因子分析モデルの回帰係数がなぜですか?
では、このスレッド@ttnphns書き込みます これは回帰係数なので[...]「変数負荷係数」よりも「変数負荷変数」の方がいいと主張します。 ここから、因子分析モデルは方程式系であることを学びました V1=a1IFI+a1IIFII+E1V1=a1IFI+a1IIFII+E1V_1 = a_{1I}F_I + a_{1II}F_{II} + E_1 V2=a2IFI+a2IIFII+E2V2=a2IFI+a2IIFII+E2V_2 = a_{2I}F_I + a_{2II}F_{II} + E_2 ......... Vp=…Vp=…V_p = … ここで、係数aは負荷、Fは係数[...]、変数Eは回帰残差です。 しかし、その逆ではなく、「ファクターロード変数」と言うべきだとは言えません。「ローディング」という用語について、それを後にするのは何ですか? また、すでに「回帰係数」という用語があったのに、なぜ「ローディング」という用語が必要なのかまったくわかりません。それは、回帰係数が相関係数を兼ねることもあり、統計学者が両方のケースをカバーする総称的な用語を必要としていたからですか? この質問に対する答えが、学生が因子が観測された変数をロードするのではなく、その逆であることを覚えやすくなることを願っています。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.