タグ付けされた質問 「teaching」

あらゆるレベルでの確率と統計の教えについての質問。

6
統計に関する講義を支援できる短いオンライン動画
統計を講義するとき、ときどき短いビデオを取り入れることは有用です。 私の最初の考えは次のとおりです。 統計概念のアニメーションと視覚化 特定の技術の応用に関するストーリー 統計的なアイデアに関連するユーモラスな動画 統計学者または統計を使用する研究者へのインタビュー 統計を教えるときに使用するビデオや、役に立つと思うビデオはありますか? どうか提供してください: オンラインのビデオへのリンク コンテンツの説明 ビデオが関係する統計トピック

5
線形回帰は時代遅れですか?[閉まっている]
閉じた。この質問は意見に基づいています。現在、回答を受け付けていません。 この質問を改善したいですか?この投稿を編集して事実と引用で答えられるように質問を更新してください。 閉じた2年前。 現在、線形回帰のクラスにいますが、私が学んでいることは、現代の統計や機械学習のどちらにももはや関係がないという感覚を揺るがすことはできません。最近、非常に多くの興味深いデータセットが線形回帰の非現実的な仮定の多くに違反しているのに、単純または多重線形回帰の推論に多くの時間を費やしているのはなぜですか?代わりに、サポートベクターマシンまたはガウス過程を使用した回帰のような、より柔軟で最新のツールの推論を教えてみませんか?スペースで超平面を見つけるよりも複雑ですが、これは現代の問題に取り組むためのより良い背景を学生に与えませんか?

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

4
コンサルティング統計学者がクライアントに提供する参考資料
この質問は、ウィキペディアなどのリソースが弱く開発されているにもかかわらず、統計と確率を自分で習得することの難しさを示しています。 コンサルティングの統計担当者、およびここに数人いる統計担当者が、特定の概念や方法をクライアントに説明するという課題に日常的に直面する可能性があることに気付きました。これは、教育コインの裏側です。概念を習得した場合、特定の分析方法を実施することは理にかなっているかもしれませんが、参照は不適切であるか、クライアントと共有するのが難しい場合があります。それでは、コンサルティング統計学者がクライアントに提案したい一般的なリソースはありますか?(より高度なまたは専門的なトピックについては、更新プログラム1を参照してください。) 役に立つかもしれないいくつかの本を考えることができますが、多くのクライアントが開発者が行ったようにウェブを検索しに行き、ウィキペディアでかなり無意味な資料に出くわすと思います。開発者への私の答えで、私はNISTハンドブックをそのようなリファレンスの1つとして使用できるように提案しました。ほかに何か? 更新1:Peter Flomが指摘したように、より高度な素材やより狭い追跡のために、単一の参照ポイントを提供することは容易ではないかもしれません。これは正しいことであり、これらのケースについては質問の表現を変えるべきでした。このような場合、コンサルタントはどのようにしてアクセス可能な参照を見つけて共有しますか?多くのコンサルタントは、クライアントに物事を説明するために何か新しいことを書くのに時間がかかると思いますが、それらは見つけられて共有される参照ではありません。 いくつかのアイデア: コンサルタントまたは他者が作成したチュートリアル 同じ概念を実証するプロジェクトのケーススタディまたは分析 概念を説明する本の抜粋(開発者への回答で提案したとおり) 他にどのような情報源がありますか、または実際にそのような参照を見つける方法は他にありますか?これは自由回答形式の質問であることに気づきましたが、開発者に対する私の答えは、この問題に取り組む方法のいくつかを示しています。これに対処できるすべての方法を尋ねるつもりはありませんが、自分の経験では、通常、このような説明リソースをどのように提供しましたか?


8
社会科学の統計学の学部入門コースを教えるのに適した統計ソフトウェアはどれですか?
社会科学研究プログラムの統計入門コースで使用できる統計ソフトウェアパッケージを探しています。学生は統計学の事前知識もプログラミング言語の経験もありません。目標は、基本的な統計概念(平均、分散、二乗和、p値など)を紹介し、サンプルデータセットを使用して独自に基本的な分析を実行できるようにすることです。コースは、公式を記憶するのではなく、統計を行うことによって概念を学ぶことに関するものでなければなりません(ただし、公式は重要だと思います)。 したがって、通常の構文(通常のRとして)またはポイントアンドクリック(SPSSまたはRcmdrとして)で駆動されるソフトウェアの代替手段を探しています。ソフトウェアは簡単に学習でき、データセットを視覚化して標準のグラフと表を提供する明確なグラフィカルユーザーインターフェイスを備えている必要があります。分析のさまざまなステップ(たとえば、データの読み取りと操作、説明的測定の計算、説明的テーブルとグラフの作成、推論的測定の計算、推論的グラフのプロット、レポートへのエクスポートなど)を視覚化するのが最適です。 統計の学習と最初の練習に適した(オープンソースまたは無料の)統計ソフトウェアの提案はありますか? 編集 あなたの提案をありがとう。私はに見てきたgretl、および他の二つのとプログラムは、私は自分自身のオンラインお問い合わせの際に発見した:RapidMinerおよび統計ラボ。[1] 私がいることを発見したgretlのインターフェースと出力がより明確であり、例えばRcmdr、SPSSやStataのより焦点を当てました。したがって、これは私の観点から統計を教えるための優れたツールです。 しかし、フローチャートGUIののRapidMinerとStatistical Lab統計分析の単一のステップ(データの読み込みから開始)を視覚化しているときに感動しました。これは、数学的な説明にいつも焦点を合わせることに苦労している多くの学生に役立つと思います。もちろん、RapidMinerは、初心者には機能、メニュー、ボタンが多すぎますが、Statistical Labはより集中しています。Statistical Labの大きなプラスは、Statistical Labが計算に依存しているRため、実際のR構文の生成を支援する「Rコードウィザード」を備えたコンソールのような「R-Calculator」です。 最後に、私は最初の学期に統計ラボから始めて、基本的な概念を紹介し、2番目の学期にRStudio(およびRcmdr)に切り替えることにしました。 [1]:Gnumeric、SciPy、Scilab、GNU Octaveなどは、社会科学にあまり関心がないようです。

1
大腸菌の発生の分析について統計学者はどんな質問をしますか?
ドイツでの最近の腸内出血性大腸菌 (EHEC)の 流行について聞いたことがあるかもしれません。 統計学者はEHEC分析についてどのような質問をしますか? 私はレポーター/公務員↔非専門家の間のQ + Aについて考えています、教師とエンジニアはディプロム/マスターの学位を持っていますが、せいぜい統計のほんの少しです。 (写真、EHECのさまざまな株を示すEHEC土地の地図、およびさまざまなテストのカバレッジは可能ですか?) 6月20日(月):EHECの発生は、世界全体で統計が本当に重要な領域であると思いました:さまざまな原因の証拠は何ですか、これらをどのように一般に伝えることができますか?それで、賞金を始めます。

6
確率の紹介で好きな問題は何ですか?
私は、少年か少女かベルトランのパラドックスを議論することによって確率を導入するのが好きです。 他にどのような(短い)問題/ゲームが確率へのやる気を起こさせる導入を提供しますか?(回答ごとに1つの回答を入力してください) PSこれは確率についての穏やかな紹介ですが、離散事象、ベイズの定理、確率的/測定可能な空間などについてさらに議論することができるので、統計教育に関連すると私は考えています。
11 teaching 

4
臨床試験に関する良いテキストは?
私は、臨床試験分析の良い治療法を探している学部の統計学の学生です。テキストは、他のトピックの中でも特に、実験計画、ブロッキング、電力分析、ラテン方格計画、クラスター無作為化計画の基礎をカバーする必要があります。 数学の統計学と実際の分析について学部の知識を持っていますが、もう少し高いレベルの統計学または分析を必要とする素晴らしいテキストがある場合、私はそれに取り組むことができます。

3
統計的概念を教えるためのクラス活動/実験?
10代の若者に統計について1時間の講義をするつもりです。たぶん一度だけ見ます。このシナリオは何度も発生する可能性があります。 彼らに統計を体験させるための活動をしたいと思います。 しかし、私は確率、統計的推論、探索的分析などについて何も知らない人々とそれを行うことを余儀なくされています。 私の考えは、メディアが時々使用するいくつかの単純な視覚化「トリック」を通過し、それを少しデバンキングすることでした。(「統計と嘘をつく方法」へのリンクを教えないでください:)) もう1つのアイデアは、(また)何かを発見するための実験を実行するための割り当てを与えることです。たとえば、彼らがコカコーラとRCコーラの違いを検出できるかどうかを発見します。 それらをどうするか、または関連資料を含むリソースについての提案を探しています。
11 teaching 

2
電力が非常に低い「難解な」統計テストはありますか?
バックグラウンド コンピュータサイエンス、数学、およびその他の分野では、「難解な」例は面白いだけでなく、特定の概念を説明するのに役立ちます。たとえば、 BogosortとSlowsortは、特に他のソートアルゴリズムと比較すると、アルゴリズムのプロパティを理解するために使用できる非常に非効率的なソートアルゴリズムです。 難解なプログラミング言語は、プログラミング言語の概念がどれほど広範囲に及ぶかを示し、優れたプログラミング言語を評価するのに役立ちます。 ワイエルシュトラス関数とディリクレ機能は、主に継続性の概念についての特定の誤解を説明するために使用を見出します。 私は現在、仮説検定の使用に関するいくつかの指導を準備しており、非常に低い検出力(ただし他の欠陥はない)での検定が統計的検出力の概念を説明するのに役立つと思います。(もちろん、私は、与えられた例が私の聴衆にとって教訓的に有用であるのか、それとも混乱するだけなのかを自分自身で決定する必要があります。) 実際の質問 意図的に低電力の統計テストはありますか? テストは仮説テストの一般的なフレームワークに適合します。つまり、このテストは帰無仮説で機能し、要件があり、(正しい)p 値を返します。 深刻なアプリケーションを対象としたものではありません。 それは非常に低い電力を持っています(意図的な設計上の欠陥によるもので、サンプルや効果のサイズが低いためではありません)。 そのようなテストは存在できないと根本的に主張できるのであれば、これも私の質問に対する有効な回答だと思います。一方、そのようなテストが多数存在する場合は、最も教育的に効率的なテストに興味があります。つまり、簡単にアクセスでき、目立つ効果があるはずです。 私はことに注意してください統計ミスの一般的な選択を求めない(チェリー・ピッキングなど)、または類似。 これまでに見つけたもの インターネット検索で何も返されませんでした。 このようなものを構築するすべての試みは、いくつかの(有用な)既存のテストで終了するか、形式が通常のテストの形式ではありません。たとえば、母集団の正の中央値がすべてのサンプルが正の場合にのみ「はい」を返すかどうかのテストについて考えました。しかし、そのテストはp 値を返さないため、通常のテストフレームワークには適合しません。正と負の符号を検定統計量として数えるだけで( それに応じてp値を計算する)、合理的な検定である符号検定で終了します。

6
ベイジアン統計を教えるための簡単な実例?
ベイジアン統計を教えるための「実世界の例」をいくつか見つけたいと思います。ベイジアン統計により、以前の知識を正式に分析に組み込むことができます。学生がベイジアン統計を最初に使用したい理由の動機をよりよく理解できるように、事前知識を分析に組み込んだ研究者の簡単な実例を学生に提供したいと思います。 研究者が以前の情報を正式に組み込んでいる、母集団の平均、比率、回帰などの推定など、実際の簡単な例を知っていますか?ベイジアンも「非情報」事前分布を使用できることを知っていますが、私は特に、情報先行(つまり、実際の事前情報)が使用される実際の例に興味があります。

3
さまざまな国での子供の統計教育?
世界のさまざまな国で子供たちがどのレベルの統計を学んでいるのか知りたいです。これに関して何が起こっているかを明らかにするデータ/リンクを提案していただけませんか? 始めます。イスラエル:多かれ少なかれ高度な数学の研究を行っている学生-平均、sd、ヒストグラム、正規分布、非常に基本的な確率。
10 dataset  teaching 

2
独立性の検定と均質性の検定
私は基本的な統計コースを教えており、今日は2つのカテゴリーの独立性のカイ2乗検定と均質性の検定について説明します。これら2つのシナリオは概念的には異なりますが、同じテスト統計と分布を使用できます。均一性のテストでは、カテゴリの1つの限界合計は、設計自体の一部であると想定されます。これらは、各実験グループに対して選択された被験者の数を表します。しかし、カイ2乗検定はすべての周辺合計の条件付けを中心に展開するため、均質性の検定とカテゴリカルデータを使用した独立性の検定を区別しても、数学的影響はありません-少なくとも、この検定を使用する場合はありません。 私の質問は次のとおりです:独立性のテスト(すべての周辺がランダム変数)または同質性のテスト(周辺の1つのセットが存在する場合)に応じて、異なる分析をもたらす統計的思考または統計的アプローチの学校はありますか?デザインで設定)? 継続的なケースでは、同じ対象についてを観察し、独立性をテストするか、または異なる母集団で観察し、それらが同じ分布に由来するかどうかをテストする場合、方法は異なります(相関分析対t検定)。カテゴリカルデータが離散化された連続変数から得られた場合はどうなりますか?独立性と均質性のテストは区別できないでしょうか?(X 1、X 2)(X,Y)(X,Y)(X,Y)(X1,X2)(X1,X2)(X_1, X_2)

2
教えるための良いPCAの例
私はエンジニア、社会科学者、コンピュータープログラマーのクラスに線形代数を教えています。特異値分解を行ったばかりで、あと1日残っているので、特異値分解と主成分分析の関係について話そうと思いました。私は講義の理論の部分をうまく書いていますが、使用する良い例を見つけるのに苦労しています。ここに制約があります: 写真を見せたいです。理想的には、グラフィックス自体がうまく機能する必要があります。散布図の軸とデータポイントにラベルを付ける必要があります。英語の単語はラテン語の種名よりも優れています。 調査中の質問は興味深いはずです。ナイジェリアの魚の形態は重要ですが、クラスの注意を引くには良い方法ではありません。 前の箇条書きとは対照的に、人種の違いについては何もありません。知能テストについては何もありません。それは数学的手法とは何の関係もない活発な議論につながるでしょう。 数学的分析方法は、基本的に純粋なPCAである必要があります。DW-NOMINATEプロジェクトは素晴らしいものですが、PCAを開始点として使用し、その後にはるかに複雑な山登りアルゴリズムが続きます。 これは簡単だと思います。データを収集する時間があれば、私ができる12の楽しい分析プロジェクトを簡単に思いつくことができます。典型的な犬の品種の物理的特性を数十回測定し、PCAが「羊犬」のクラスターを見つけられるかどうかを確認します。Etcetera、etcetera ...私はそれを誇示できるように、すでに仕事をした人を探しています。 ここのタイムラインはかなりタイトだと思います。明日の午後(月曜日)に講義します。私は週末のほとんどをPCAのさまざまな興味深い分野での調査に費やし、それらが適切でないことを何度も繰り返し発見しました。
10 pca  dataset  teaching 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.