教師と思慮深い生徒との対話
これまでのところ、このスレッドでは十分なクレヨンが使用されていないという信念で謙虚に提出しました。最後に簡単な図解の概要が表示されます。
学生:p値とはどういう意味ですか?多くの人々は、それが統計以上の「サンプル平均を見る」チャンスである、または「帰無仮説が真である場合、この結果を観察する確率」または「私のサンプルの統計[シミュレートされた]分布」、さらに「帰無仮説が真であると仮定して計算されたものと少なくとも同じ大きさの検定統計量を観測する確率」に落ちます。
先生:適切に理解されていて、これらのすべての記述は多くの状況で正しいです。
学生:それらのほとんどがどのように関連しているかわかりません。帰無仮説と対立仮説H Aを述べる必要があることを教えてくれませんでしたか?彼らは、「以上」または「少なくとも同じくらい」または非常に人気のある「より極端な」というこれらのアイデアにどのように関与していますか?H0HA
先生:それは一般的に複雑に見えるかもしれないので、具体的な例を探求するのに役立つでしょうか?
学生:もちろん。ただし、可能であれば、現実的でシンプルなものにしてください。
先生:仮説検定のこの理論は歴史的に、天文学者が観測誤差を分析する必要から始まったので、そこから始めてみてはどうでしょうか。ある日、科学者が自分の装置の測定誤差を減らす努力を説明した古い文書をいくつか読んでいた。彼は、既知の位置にある星の多くの測定を行い、その位置の前後の変位を記録しました。それらの変位を視覚化するために、彼は、ヒストグラムを描画しました-少し滑らかにすると、このように見えます。
学生:ヒストグラムの仕組みを覚えています。縦軸に「密度」というラベルが付いており、測定の相対周波数が高さではなく面積で表されていることを思い出させます。
先生:そうです。「異常な」または「極端な」値は、非常に小さな領域を持つ領域に配置されます。これがクレヨンです。面積が全体の10分の1の領域に色を付けることができると思いますか?
学生:もちろん。簡単だ。[図の色。]
先生:とても良い!それは私にとって面積の約10%のように見えます。ただし、ヒストグラムの重要な領域は垂直線の間の領域のみであることに注意してください。これらの領域は、水平軸上のこれらの線の間に変位が配置される可能性または確率を表します。 つまり、一番下まで色を塗る必要があり、それは半分以上の面積になるということですね。
学生:ああ、なるほど。もう一度試してみましょう。曲線が本当に低いところに色をつけたいと思いませんか?両端で最低です。1つの領域だけを着色する必要がありますか、それをいくつかの部分に分割しても大丈夫でしょうか?
先生:複数のパーツを使用するのは賢明なアイデアです。彼らはどこにいるのでしょうか?
学生(ポインティング):こことここ。このクレヨンはあまりシャープではないため、使用している線をペンで示しました。
先生:いいね!残りの話をさせてください。科学者はデバイスにいくつかの改善を加えた後、追加の測定を行いました。彼は、最初の変位はわずかであり、良い兆候だと考えたが、注意深い科学者であるため、チェックとしてさらに測定を進めたと書いた。残念ながら、これらの他の測定値が失われる-原稿は、この時点で途切れる-と我々が持っているすべては、その単一の番号である0.1。0.10.1
学生:それは残念です。しかし、それはあなたのフィギュアの変位の広い広がりよりもはるかに優れていませんか?
先生:それが質問です。まず、として何を仮定すべきでしょうか?H0
学生:ええと、懐疑論者は、デバイスに加えられた改善がまったく効果を発揮したのかどうか疑問に思うでしょう。立証責任は科学者にあります:彼は懐疑論者が間違っていることを示したいと思うでしょう。そのため、帰無仮説は科学者にとってはやや悪いと思うようになります。新しい測定値(の値を含む)は、最初のヒストグラムで説明されているように動作するはずです。または、それよりもさらにひどい場合があります。0.1
先生:続けて、元気です。
学生:それで、代替案は、新しい測定値の広がりが少ないということですよね?
先生:とても良い!広がりの少ないヒストグラムがどのように見えるかを描いていただけますか?最初のヒストグラムの別のコピーを次に示します。その上に参照として描画できます。
学生(描画):新しいヒストグラムの輪郭を描くためにペンを使用しており、その下の領域に色を付けています。水平軸上で曲線のほとんどがゼロに近く、その領域のほとんどがゼロの(水平)値に近いようにしました。つまり、広がりを小さくするか、より正確にするということです。
先生:それは良いスタートです。ただし、確率を示すヒストグラムの総面積は1でなければならないことに注意してください。したがって、最初のヒストグラムの総面積は1です。新しいヒストグラム内の面積はどれくらいですか?11
学生:半分以下だと思います。私はそれが問題だと思っていますが、それを修正する方法がわかりません。私は何をすべきか?
先生:トリックは、新しいヒストグラムを古いヒストグラムよりも高くして、その合計面積がなるようにすることです。ここでは、説明のためにコンピューター生成バージョンを紹介します。1
学生:なるほど:縦に伸ばしたので、形は実際には変わりませんが、赤い領域と灰色の領域(赤の下の部分を含む)は同じ量になりました。
先生:そうです。帰無仮説の写真(青色で広がり)と対立仮説の一部(赤色で広がりの少ない)を見ています。
学生:選択肢の「一部」とはどういう意味ですか?それだけではない代替仮説?
先生:統計学者と文法は混ざっていないようです。:-)真剣に、彼らが「仮説」によって意味することは、通常、大きな可能性の完全なセットです。ここで、代替手段(前に非常によく述べたように)は、測定値が以前よりも「広がっていない」ことです。しかし、どれだけ少ないのですか?多くの可能性があります。ここで、別の例を示します。黄色のダッシュで描いた。前の2つの間にあります。
学生:なるほど。スプレッドの量はさまざまですが、スプレッドが実際にどれくらいになるかは事前にはわかりません。しかし、なぜこの写真に面白い陰影を付けたのですか?
先生:ヒストグラムがどこでどのように異なるかを強調したかった。代替ヒストグラムがヌルよりも低い場合はグレーで、代替がより高い場合は赤で影を付けました。
学生:なぜそれが重要なのですか?
先生:両方の尾の最初のヒストグラムをどのように色付けしたのか覚えていますか?[論文を見てください。]ああ、ここにあります。同じようにこの写真に色を付けましょう。
学生:私は覚えています:これらは極端な値です。ヌル密度が可能な限り小さく、その領域の10%で色付けされている場所を見つけました。
先生:これらの極端な分野での代替案について教えてください。
学生:クレヨンで覆われているので見づらいですが、私が色付けした領域に代替物が存在する可能性はほとんどないようです。それらのヒストグラムは値軸に対して真下にあり、それらの下に領域の余地はありません。
先生:その考えを続けましょう。私はあなたに言った場合、仮に、測定値がずれていたこと、そして、それが最も可能性が高いから来たものだったこれら3つのヒストグラムのどの選択するあなたを尋ね、それはでしょうか?−2
学生:最初の1つ-青いもの。これは、最も広がって、それは一つだけだだ発生し、任意のチャンスを持っているようです。−2
先生:原稿のの値はどうですか?0.1
学生:うーん...それは別の話です。3つすべてのヒストグラムは、地上でかなり高くなっています。0.1
先生:はい、結構です。しかし、値が0から0.2の間など、近くにあると言ったとします。これらのグラフからいくつかの確率を読み取るのに役立ちますか?0.100.2
学生:確かに、私はエリアを使用できるからです。から0.2までの各曲線の下の面積を見積もる必要があります。しかし、それはかなり難しいようです。00.2
先生:そこまで行く必要はありません。どのエリアが最大かわかりますか?
学生:もちろん、最も高い曲線の下にあるもの。3つの領域はすべて同じベースを持っているため、曲線が高いほど、その下とベースの下にある領域が多くなります。これは、最も高いヒストグラム(赤い破線で描いたもの)が変位に対して最も可能性の高いヒストグラムであることを意味します。私はあなたがこれでどこに行くのか見ていると思いますが、少し心配しています:ここに示されている1つまたは2つだけでなく、すべての選択肢のすべてのヒストグラムを見る必要はありませんか?どうすればそれを行うことができますか?0.1
先生:あなたはパターンを拾うのが得意だから、教えてください。測定装置がますます正確になるにつれて、そのヒストグラムはどうなりますか?
03/4
11
先生(続き):選択肢がヌルよりもありそうな場所を教えてください。
スチューデント(カラーリング):ここの真ん中です。そして、これらはもはやヒストグラムではないので、エリアではなく高さを見るべきだと思うので、水平軸で値の範囲をマークしています。しかし、どのように中間の色を塗りつぶすかをどのように知ることができますか?どこで着色をやめますか?
先生:確固たるルールはありません。それはすべて、結論をどのように使用するか、そして懐疑論者がどれほど激しいかによって異なります。しかし、ゆっくりと座って何を達成したかを考えてください。大きな尤度比の結果は代替案の証拠であり、小さな尤度比の結果は代替案に対する証拠であることがわかります。できる限り、帰無仮説の下で発生する可能性が低く、代替の下で発生する可能性が比較的高い領域に色を付けることをお願いします。最初に色付けした図に戻り、会話の始めに戻ると、ヌルの2つのテールが「極端な」ために色付けしました。彼らはまだ良い仕事をしますか?
3.03.0
先生:それは何を表していますか?
学生:元のヒストグラムの下の領域の10%だけを描画するように私に依頼してきました。だから今、私は代替案が発生する可能性が高いと思われるエリアの10%を描きました。その分野で新しい測定が行われたとき、私たちは代替案を信じるべきだと言っていると思います。
先生:そして、それに対して懐疑論者はどのように反応すべきですか?
学生:懐疑論者は決して自分が間違っていると認める必要はありませんか?しかし、彼の信仰は少し揺さぶられるべきだと思います。結局、私たちはそれを、私が描いたばかりの領域内に測定値が入る可能性があるが、nullが真であるときにそこにいる可能性が10%だけになるように調整しました。そして、代替案が真実である場合、そこにいる可能性がより大きくなります。科学者が装置をどれだけ改良したかに依存するため、その可能性がどれほど大きいかを伝えることはできません。私はそれが大きいことを知っています。したがって、証拠は懐疑論者に反するでしょう。
先生:わかった。あなたが学んだことを完全に明確にするために、あなたの理解を要約してもらえますか?
学生:対立仮説を帰無仮説と比較するには、ヒストグラムを比較する必要があることを学びました。選択肢の密度をヌルの密度で除算します。これを「尤度比」と呼びます。良いテストを行うために、10%のような小さな数、または懐疑論者を揺さぶるのに十分なものを選ぶべきです。次に、尤度比が可能な限り高い値を見つけ、10%(または何でも)が色付けされるまで色付けします。
先生:そして、そのカラーリングをどのように使用しますか?
学生:先ほど思い出したように、色は縦線の間になければなりません。カラーリングの下にある値(水平軸)は、帰無仮説に対する証拠です。その他の値-関係するすべてのヒストグラムを詳細に調べることなく、それらが意味するものを言うのは難しいです。
0.1
学生:それは私が最後に色付けした範囲内だから、科学者はおそらく正しかったと思うし、装置は本当に改善されたと思う。
先生:最後にもう1つ。あなたの結論は、10%を基準、つまりテストの「サイズ」として選択することに基づいていました。多くの人は、代わりに5%を使用することを好みます。1%を好む人もいます。あなたは彼らに何を伝えることができますか?
00.10.050.10.080.1。彼らは私がしたのと同じ結論には至らないだろう:彼らは実際に変化が起こったという十分な証拠がないと言うだろう。
0.08
学生:ありがとう。私はまだこのすべてを完全に理解しているとは思いませんが、あなたは私に多くのことを考えさせてくれました。
先生:さらに先に進みたい場合は、Neyman-Pearson Lemmaをご覧ください。おそらく今理解する準備ができているでしょう。
あらすじ
ztt=0.1
0t=0.1が達成された。p値は、nullヒストグラムの下の影付き領域の面積です。nullがtrueであると仮定すると、どの選択肢がtrueであるかに関係なく、尤度比が大きくなる傾向がある結果を観察する機会です。特に、この構造は対立仮説に密接に依存しています。可能な代替手段を指定せずに実行することはできません。