回答:
これは素晴らしい質問であり、p値と両側検定と片側検定の説明の全員版を楽しみにしています。私は仲間の整形外科医の統計を教えてきました。そのため、ほとんどの人は10〜30年間高度な数学を行っていないため、できるだけ基本的な統計を維持しようとしました。
私は、公正なコインを持っていると信じるなら、平均してフリップの50%のテール()になることを知っているという説明から始めます。このフェアコインで10フリップのうち2テールしか得られない確率がどうなるか疑問に思ったら、棒グラフで行ったようにその確率を計算できます。グラフからは、10の8アウトを得る確率はおよそについてです公正なコインで反転していることがわかります≈ 4.4 %。
9個または10個のテールを取得した場合、コインの公平性を疑問視するため、これらの可能性、つまりテストのテールを含める必要があります。値を追加することにより、2テール以下の確率のを超える確率が得られます。
ここで、2つのヘッド、つまり8つのヘッド(他のテール)だけを取得する場合、コインの公平性を疑問視するのはおそらく同じでしょう。あなたがの確率で終わることをこの手段のための両側検定。
医学の私たちは通常、失敗を研究することに興味があるので、たとえ善行を行い、有益な治療を導入することが目的であっても、確率の反対側を含める必要があります。
この単純な例は、p値を計算するために帰無仮説にどの程度依存しているかを示しています。また、二項曲線と釣鐘曲線の類似点を指摘したいと思います。200回のフリップに変更すると、100回のフリップが発生する確率が関連性を失い始める理由を説明する自然な方法が得られます。対象の定義区間は、確率密度/質量関数関数とそれに対応する累積関数への自然な遷移です。
私のクラスでは、カーンアカデミーの統計ビデオをお勧めします。また、特定の概念については彼の説明の一部を使用しています。彼らはコインを反転させることもできます。コインの反転のランダム性を調べると、このRadiolabエピソードからインスピレーションを得たものよりもランダム性がランダムであることがわかります。
通常、1つのグラフ/スライド、つまりグラフの作成に使用したRコードがあります。
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
男性の平均身長が「5フィート7インチ」であるという仮説をテストするとします。男性のランダムサンプルを選択し、男性の身長を測定し、サンプル平均を計算します。あなたの仮説は次のとおりです。
上記の状況では、サンプル平均が低すぎるか高すぎる場合にヌルを拒否するため、両側検定を行います。
この場合、p値は、ヌルが実際に真であると仮定して、実際に取得したものと少なくとも同じくらい極端なサンプル平均を実現する確率を表します。したがって、サンプルの平均が「5 ft 8インチ」である場合、p値は、「5 ft 8インチ」を超える高さまたは「5 ft 6インチ」未満の高さが観察される確率を表します。本当です。
一方、代替案が次のようにフレーム化されている場合:
上記の状況では、右側で片側検定を行うことになります。その理由は、サンプルの平均が非常に高い場合にのみ、代替を支持してヌルを拒否することを好むからです。
p値の解釈は、実際に得られたものよりも大きい標本平均を実現する確率について今話しているわずかなニュアンスと同じままです。したがって、サンプル平均が「5 ft 8インチ」である場合、p値は、nullが真である場合に「5 ft 8インチ」より大きい高さを観測する確率を表します。