両側検定の説明


16

私は、生徒に(初等統計学コースで)両側検定とは何か、またそのP値がどのように計算されるかを説明するさまざまな方法を探しています。

両側検定と片側検定を生徒にどのように説明しますか?

回答:


16

これは素晴らしい質問であり、p値と両側検定と片側検定の説明の全員版を楽しみにしています。私は仲間の整形外科医の統計を教えてきました。そのため、ほとんどの人は10〜30年間高度な数学を行っていないため、できるだけ基本的な統計を維持しようとしました。

p値とテールの計算を説明する私の方法

私は、公正なコインを持っていると信じるなら、平均してフリップの50%のテール()になることを知っているという説明から始めます。このフェアコインで10フリップのうち2テールしか得られない確率がどうなるか疑問に思ったら、棒グラフで行ったようにその確率を計算できます。グラフからは、10の8アウトを得る確率はおよそについてです公正なコインで反転していることがわかります4.4 =H04.4

9個または10個のテールを取得した場合、コインの公平性を疑問視するため、これらの可能性、つまりテストのテールを含める必要があります。値を追加することにより、2テール以下の確率のを超える確率が得られます。5.5

ここで、2つのヘッド、つまり8つのヘッド(他のテール)だけを取得する場合、コインの公平性を疑問視するのはおそらく同じでしょう。あなたがの確率で終わることをこの手段のための両側検定5.4 ...+5.4 ...10.9

医学の私たちは通常、失敗を研究することに興味があるので、たとえ善行を行い、有益な治療を導入することが目的であっても、確率の反対側を含める必要があります。

フリッピングコイングラフ

トピックから少し外れた反射

この単純な例は、p値を計算するために帰無仮説にどの程度依存しているかを示しています。また、二項曲線と釣鐘曲線の類似点を指摘したいと思います。200回のフリップに変更すると、100回のフリップが発生する確率が関連性を失い始める理由を説明する自然な方法が得られます。対象の定義区間は、確率密度/質量関数関数とそれに対応する累積関数への自然な遷移です。

私のクラスでは、カーンアカデミーの統計ビデオをお勧めします。また、特定の概念については彼の説明の一部を使用しています。彼らはコインを反転させることもできます。コインの反転のランダム性を調べると、このRadiolabエピソードからインスピレーションを得たものよりもランダム性がランダムであることがわかります。

コード

通常、1つのグラフ/スライド、つまりグラフの作成に使用したRコードがあります。

library(graphics)

binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0, 
                                col=c("green", "gold", "red")){
  barplot(
    dbinom(0:x_max, x_max, my_prob)*100, 
    col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
    #names=0:x_max,
    ylab="Probability %",
    xlab="Number of tails", names.arg=0:x_max)
  if (my_title != FALSE ){
    title(main=my_title)
  }
}

binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))

素晴らしい答えマックス-そして私の質問の非自明性を認識してくれてありがとう:)
タルガリリ

+1いい答え、非常に徹底的。私を許してください、しかし、私は2つのことを厳選するつもりです。1)p値は、nullの下でデータと同じか極端なデータの確率として理解されるため、答えは正しいです。ただし、コインフリップのような個別のデータを使用する場合、これは不適切に保守的です。「中間p値」と呼ばれるものを使用するのが最善です。つまり、データの極端な確率の1/2 +より極端なデータの確率。これらの問題の簡単な議論は、Agresti(2007)2.6.3にあります。(続き)
グン-モニカの復職

2)ランダム性は、私たちが信じているよりもランダムであると述べています。私はあなたがそれによって何を意味するのか推測できます(リンクするRadiolabエピソードを聞く機会はありませんでしたが、私はそうします)。不思議なことに、私は常に、ランダム性はあなたが信じているほどランダムではないことを学生に伝えてきました。ここでは、縞模様(ギャンブルなど)の認識について言及しています。人々は、ランダムなイベントが実際に行うよりもはるかに頻繁に交互になるべきであると信じており、その結果、彼らは縞模様を見ると信じています。フォーク(1997)ランダム性の理解Psych Rev 104,2を参照してください。繰り返しますが、あなたは間違っていません-ただ考えのための食べ物。
GUNG -復活モニカ

ご意見ありがとうございます。私は実際に中間値のことを聞いていません-しかしそれは理にかなっています。基本的な統計を教えるときに言及するものかどうかはわかりませんが、それは私が与えようとする実践的な感覚を失う感覚を与えるかもしれないからです。ランダム性に関しては、まったく同じことを意味します。真にランダムな数を見ると、パターンがあると考えるのにだまされます。私はポッドキャストFreakonomicsに聞いたと思います予測の愚かさ ...ということ
マックス・ゴードン

...人間の心は長年にわたって、捕食者の検出に失敗することは、それがおそらく何もないと考えるよりも費用がかかることを学びました。私はその類推が好きで、統計を使用する主な理由の1つは、私たち全員が生まれたこの欠陥を手伝うことだと同僚に伝えようとしています。
マックスゴードン

9

男性の平均身長が「5フィート7インチ」であるという仮説をテストするとします。男性のランダムサンプルを選択し、男性の身長を測定し、サンプル平均を計算します。あなたの仮説は次のとおりです。

H0μ=5 フィート 7 インチ

HAμ5 フィート 7 インチ

上記の状況では、サンプル平均が低すぎるか高すぎる場合にヌルを拒否するため、両側検定を行います。

この場合、p値は、ヌルが実際に真であると仮定して、実際に取得したものと少なくとも同じくらい極端なサンプル平均を実現する確率を表します。したがって、サンプルの平均が「5 ft 8インチ」である場合、p値は、「5 ft 8インチ」を超える高さまたは「5 ft 6インチ」未満の高さが観察される確率を表します。本当です。

一方、代替案が次のようにフレーム化されている場合:

HAμ>5 フィート 7 インチ

上記の状況では、右側で片側検定を行うことになります。その理由は、サンプルの平均が非常に高い場合にのみ、代替を支持してヌルを拒否することを好むからです。

p値の解釈は、実際に得られたものよりも大きい標本平均を実現する確率について今話しているわずかなニュアンスと同じままです。したがって、サンプル平均が「5 ft 8インチ」である場合、p値は、nullが真である場合に「5 ft 8インチ」より大きい高さを観測する確率を表します。


2
HAH0μ5 フィート 7 インチH0μ=5 フィート 7 インチ

2
@chl同意します。ただし、統計的アイデアを紹介したばかりの人にとって、p値の解釈に関して物事がどのように、なぜ変化するかに焦点を当てている場合、片側検定のヌルを書き直すことは注意散漫になる可能性があります。
varty

1
けっこうだ。ただし、教育目的であっても、言及する価値があります。
chl
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.