XKCDのフリークエンティスト対ベイジアンコミックの何が問題になっていますか?


113

xkcdコミック番号1132

このxkcdコミック(フリークエンティスト対ベイジアン)は、明らかに間違った結果を導き出す頻度の高い統計学者をからかいます。

しかし、彼の推論は標準的な頻度主義の方法論に従うという意味で実際に正しいように思えます。

私の質問は、「彼は頻繁な方法論を正しく適用しているのですか?」です。

  • 「いいえ」の場合:このシナリオで正しい頻度の推論は何ですか?太陽熱安定性に関する「事前知識」を頻繁な方法論に統合するには?
  • はいの場合:wtf?;-)

17
Gelmanのブログに関するディスカッション:andrewgelman.com/2012/11/16808
グレン

5
頻度論者とベイジアンの両方の観点から、多くのことが間違っていると思います。それぞれ最大の批判:最初に、P値は最終的にヒューリスティックであり、統計的な問題、データ、実験を含む多くの物の特性です。ここでは、その特定の質問に対して3つすべてが著しく不正確に表現されています。第二に、「ベイジアン」は、ベイジアンである必要のない決定理論的アプローチを使用します。しかし、それは面白いです。
モモ

5
統計の領域からそれを取り出すために....太陽は新星に行くほど十分に大きくありません。QED、ベイジアンは正しい。(太陽は代わりにレッドジャイアントになる
ベンブロッカ

3
@Glen et alii、特に、Randall MunroeのGelmanへの応答に注意してください:andrewgelman.com/2012/11/16808/#comment-109366
jthetzel

2
ここでフリークエンシーの統計学者が愚かである理由は、彼がフリークエンシーであるからではなく、彼が明らかに機械の仕組みを知っているので、それが不適切な測定であることを知っており、とにかく推論をするからです。
-rvl

回答:


44

主な問題は、最初の実験(Sun gone nova)が反復可能でないことです。このため、確率を、イベントがどれくらいの頻度で与えているかの推定として解釈し、何度も実験を繰り返すことができる頻度論の方法論には非常に不適切です。対照的に、ベイジアン確率は、利用可能なすべての事前知識を提供する私たちの信念の程度として解釈され、1回限りの出来事に関する常識的な推論に適しています。サイコロ投げの実験は再現可能ですが、フリークエンシストが最初の実験の影響を意図的に無視し、得られた結果の重要性に自信を持っていることはほとんどありません。

著者は再現性のある実験への頻繁な依存と事前の不信を模倣しているように見えますが、実験セットアップの不適性を頻繁な方法論に与えているように見えますが、この漫画の本当のテーマは頻繁な方法論ではなく、一般的に不適切な方法論の盲目的なフォローです。面白いかどうかはあなた次第です(私にとってはそうです)が、2つのアプローチの違いを明らかにするよりも誤解を招くと思います。


1
(1)この上の素敵なリファレンス強く、決定的な frequentismで再現性の仮定は、ある科学の統計的推論(2000年)、第1章(どちら伝えることは困難であることを非常に多くの問題があるが、主なもの)

36
それほど速い再現引数と...まず、再現性のある実験機の照会は、太陽が新星にの真実つもりはないことは、推論の固定ではなく、未知のオブジェクトです。クエリの実験は確かに繰り返すことができ、それがさらに数回あれば、頻繁な戦略は簡単に合理的に思えるかもしれません。
共役前

6
第二に、とにかく再現性ビジネスで厳しすぎてはなりません。実験以外の状況では、頻度の高い人がまったく何も推測できないようにするためです。しばらくの間、「sun goes nova」がイベントの候補であると想定します。私は物理学者ではありませんが、「太陽が新星になる」というイベントはかなり頻繁に起こると言われているので(この辺りではあまりありません)、これは繰り返しのように聞こえます。いずれにせよ、David Cox( 'Foundations of Statistics')のような人々は、「考えられる繰り返しはほとんど常に仮説である。これ自体は欠点ではないようだ」と言っています。
共役前

7
太陽を平行宇宙の太陽の集団からのランダムなサンプルとして見ることができ、量子ミラーさえあれば原理的に実験を繰り返すことができます!; o)
ディクランマースピアル

2
なぜ爆発する太陽のチェックが再現できないのですか?私は毎朝チェックしていますが、まだ爆発していません。
GKFX

27

私が見る限り、これまでのところ、頻度主義者のビットは合理的です:

してみましょう太陽が爆発していないと仮定することそれが持っているという仮説をすること。したがって、p値は下で結果(マシンが「yes」と言っている)を観察する確率です。ニュートリノの不在の存在をマシンが正しく検出すると仮定すると、マシンが下で「はい」と言った場合、それはマシンが2つの6を回転させた結果、私たちに横たわっているためです。したがって、p値は1/36であるため、通常の準フィッシャーの科学的慣行に従って、頻度主義者は有意性の95%レベルで帰無仮説を拒否します。H 1 H 0 H 0H0H1H0H0

ただし、帰無仮説を棄却しても、対立仮説を受け入れる資格があるわけではないため、分析によって頻度主義者の結論は正当化されません。頻繁な仮説検定は、偽造(一種の)の概念を具体化するものであり、何も真実ではないことを証明するだけで、反証するだけです。あなたが主張したいのであれば、あなたが想定し真であり、あなたがいることを示すことができた場合にのみ続行データと矛盾しています。ただし、それはが真であることを意味するものではなく、テストを生き延び、少なくとも次のテストまで実行可能な仮説として継続するというだけです。H 0 H 0 H 1H1H0H0H1

ベイジアンも単に常識であり、賭けをすることによって失うものは何もないことに留意します。偽陽性と偽陰性のコストを考慮すると(Neyman-Peason?)、長期的な利益という点で最良の戦略であると同じ結論が導かれることになると確信しています。

要約すると:ここでは、フリークエンシーとベイジアンの両方がずさんです:適切なレベルの重要性、偽陽性/偽陰性のコスト、または問題の物理学(つまり、常識を使わない)を考慮せずにレシピを盲目的にフォローするフリークエンシー。ベイジアンは自分の事前分布を明示的に述べていないためだらしているが、再び常識を使用して、彼が使用している事前分布は明らかに正しい(実際に爆発した太陽よりも機械が横たわっている可能性がはるかに高い)ため、ずさんなことはおそらく許される。


4
帰無仮説を棄却するということは、単にH0が真である場合に観測が起こりそうにないことを意味します。H0が真の場合、観測値はありそうにないため、H1は真でなければならないと基本的に言っているため、これに基づいてH1を「受け入れる」べきではありません。ただし、観測はH1(ヌル儀式では無視される)のもとでは起こりにくく、H1はH0 a-priori(ヌル儀式でも無視される)よりも低い可能性があります。仮説を受け入れることは、頻繁なテストをベイジアンテストとして解釈するための滑りやすい傾向であり、一般的に、初歩的なケースでは誤解を招きます。
ディクラン有袋類

4
あなたのコメントにつまずいた。そして、@ glassyと同じ質問があります。あなたの仮説が出来事の空間全体をカバーしている場合、ここで{"Sun has gone nonova"、 "Sun's go nova"}である場合、「 「太陽は新星になりました」は自動的に「太陽は新星に行かなかった」につながりません。ステートメントを偽と宣言することは、その否定が真でなければならないことを意味します。可能であれば、この点が明確に説明されている信頼できる参照テキストを提供することは素晴らしいことです。それについてもっと知りたいです。
意味する意味

3
帰無仮説を棄却することは、帰無仮説がおそらく偽であることを自動的に意味するのではなく、対立仮説を継続することが合理的であることだけを意味します。これは(部分的に)頻繁な仮説検定では仮説の事前確率を考慮しないためです。より基本的には、頻度論的手法を使用して特定の仮説の真理に確率を割り当てることはできません。そのため、「帰無仮説を棄却できる」と「帰無仮説はおそらく誤りである」間のリンクは完全に主観的なものです。私は見えます。
ディクランマースピアル

2
これは私の意見の一種です。H1を受け入れるかどうかの決定は主観的であり、「H0の拒否は通常 H1の受け入れにつながる」というテストの結果の必要な結果ではありません。問題は、決定に必要な情報[P(H0)、P(H1)、P(Z | H1)]がテストに表示されないことです。本質的に、この情報の一部はしきい値の設定に部分的に含まれていますが、これは一般的に不完全であり、多くの場合、記述されておらず、正当化されていません。事前は、頻繁に行われるテストでも同様に主観的ですが、暗黙のうちに残されています-両方の世界で最悪です!; o)
ディクランマースピアル14

3
@Dikran、私たちはお互いをよく理解していて、コメントセクションの乱用をやめるべきだと思いますが、最後の発言:主観的に選択された基づいて主観的に [amoeba-reject] H0を拒否すること選択した場合、私は主観的に H1を受​​け入れることを選択します P(H1)の私の主観的専門家評価。「H0をアメーバ拒否できるからといってH1を受け入れざるを得ない」と言っても、言語学的な意味はありません。しかし、「5%レベルでH0を拒否できるからといって、H1を受け入れる必要はありません」ということに同意します。私の主なポイント:5%レベルでH0を拒否できること rejecting α
アメーバ14

25

この結果が「間違っている」ように見えるのはなぜですか?ベイジアンは、太陽がいつ爆発するかについて「事前の」信念を持っているため、結果は直観に反すると思われます。コイン投げ)。しかし、頻度の高い人はそのような評価をすることができます、彼は単に信念とは対照的に、データのコンテキストでそれをしなければなりません。

パラドックスの本当の原因は、実行される頻繁な統計テストが利用可能なすべてのデータを考慮していないという事実です。コミックの分析に問題はありませんが、太陽が長時間爆発しない可能性が最も高いことがわかっているため、結果は奇妙に見えます。しかし、これをどのように知っていますか?なぜなら、太陽がいつ爆発するかを制限できる測定、観測、およびシミュレーションを行ったからです。したがって、私たちの完全な知識は、これらの測定値とデータポイントを考慮に入れる必要があります。

ベイジアン分析では、これらの測定値を使用して事前分布を構築します(ただし、測定値を事前分布に変換する手順は明確に定義されていません。ある時点で初期事前分布が必要です。方法」)。そのため、ベイジアンが自分の事前分布を使用するとき、彼は頻繁に、頻度分析者のp値分析では得られない多くの追加情報を考慮しています。

したがって、対等な立場を保つために、問題の完全な頻度分析には、ベイジアン事前分布の構築に使用される太陽爆発に関する同じ追加データを含める必要があります。しかし、頻繁に使用するのではなく、頻度を使用して、他の測定値を組み込むために使用する可能性を単純に拡張し、その完全な可能性を使用してp値を計算します。

LL=L(マシンはい| Sunは爆発した)*(太陽に関する他のすべてのデータ| Sunは爆発した)L

完全な頻度分析では、尤度の2番目の部分がより制約的であり、p値計算への支配的な貢献になることがほとんどの場合示されます(太陽に関する豊富な情報と、この情報に関するエラーがあるため)小さい(できれば))。

実際には、頻繁に計算を行うために過去500年から取得したすべてのデータポイントを収集する必要はありません。太陽が爆発したかどうかの不確実性をエンコードする単純な尤度項としてそれらを近似できます。これはベイジアンの事前に似ていますが、可能性があるため、哲学的にわずかに異なります。つまり、事前の信念をエンコードする事前とは対照的に、以前の測定値をエンコードすることを意味します。この新しい用語は尤度の一部となり、信頼区間または事後確率を形成するために統合されるベイズ事前分布とは対照的に、信頼区間(またはp値など)を構築するために使用されます。


1
これは、受け入れられた回答または最も投票された回答でなければなりません。
アメリオバスケスレイナ14

11

私が見る最大の問題は、導出された検定統計がないことです。値のために(ベイズ統計は、それに対して取り付けることが全ての批評を有する)-value検定統計量のとして定義されている(、統計の場合のように、値が大きい場合はnullが拒否されると仮定します)。より重要な決定に到達する必要がある場合は、重要な値を増やして拒否領域をさらに押し上げることができます。事実上、これはBonferroniのような複数のテスト修正が行うことであり、に対してはるかに低いしきい値を使用するように指示します。T T P R O B [ T ≥のT | H 0 ] T χ 2 P 0 1 / 36 2 / 36 ...ptTProb[Tt|H0]Tχ2p値。代わりに、のグリッド上のサイズのテストを頻繁に行う統計学者がここで立ち往生しています。0,1/36,2/36,

もちろん、この「頻度の高い」アプローチは非科学的であり、結果はほとんど再現できません。太陽が超新星になると、超新星のままになるため、検出器は何度も「はい」と発声し続ける必要があります。ただし、このマシンを繰り返し実行しても、「はい」の結果が再び得られることはほとんどありません。これは、自分自身を厳密なものとして提示し、実験結果を再現しようとする分野で認識されています...私が理解している限り、確率は5%の間です一部の医療分野では約30〜40%です。メタ分析の人々はより良​​い数字であなたを埋めることができます、これは統計グレープバインを通して時々私に出くわす単なる話題です。

「適切な」頻度主義の観点からのもう1つの問題は、サイコロを振るのが最も低いテストであり、パワー=有意水準(低くない場合。5%の有意水準で2.7%の電力は自慢できません)です。T検定のネイマンピアソン理論は、これがUMPTであることを実証することに苦しみます。テストは、特定のクラスで最も強力なテストです。(クレジット:@Dikran Marsupialはコメントの1つで権力の問題に言及しました。)

これがあなたを困らせるかどうかはわかりませんが、ベイジアン統計学者は数学を知らず、ギャンブルの問題がある人としてここに示されています。適切なベイジアン統計学者は、事前確率を仮定し、その客観性の程度について議論し、事後確率を導き出し、データからどれだけ学んだかを示します。いずれも行われなかったため、ベイジアンプロセスは、頻度の高いプロセスと同じくらい単純化されています。

この状況は、がんの問題に対する古典的なスクリーニングを実証しています(そして、生物統計学者はそれを私ができるよりもうまく説明できると確信しています)。不完全な機器で希少疾患をスクリーニングすると、ほとんどの陽性は偽陽性であることがわかります。賢い統計学者はそれを知っており、安価で汚れたスクリーナーをより高価でより正確な生検で追跡することをよく知っています。


2
最初の段落を正しく理解していれば、しきい値(コミックでは0.05)が高すぎます。コミックに2つではなく5つのサイコロがある場合、しきい値が十分に低いと受け入れますか?とにかくしきい値をどのように決定しますか?
シュリーバツァー

9
ベイズ統計学者は、太陽が爆発する可能性は、機械が横たわる可能性よりもはるかに小さいことを考慮に入れただけだと思った(したがって、必ずしも無知なギャンブラーではない)。
ジョシュ・

8
端的に言え:太陽が新星になった場合、賭けの勝者は...彼の50 $を現金することができません
はKjetil BはHalvorsenの

6
ここでのポイントは、分析の本当の目的を考えることなく、頻繁な統計学者がレシピに従っていることです。いわゆる「ベイジアン」は実際にはベイジアンではなく、単に常識を使っている人です。科学ジャーナルに続く盲目のレシピの例はたくさんあります。それが漫画が面白い理由です。
ディクランマースピアル

3
検定統計量の不足は、私が考えていない問題にはなり得ません。検定統計量は、データの単なる機能です。したがって、少なくとも原則として、恒等関数、つまりここではデータ自体が機能しているように見えます。
共役前

6

このコミックには何の問題もありません。その理由は統計とは関係ありません。それは経済です。頻度が正しければ、地球は48時間以内に住むことができなくなります。50 ドルの値は事実上nullになります。これを認識しているベイジアンは、通常の場合は自分の利益が50 ドルであり、太陽が爆発した場合はほとんど利益がないことを賭けに賭けることができます。


ベイジアン統計は明示的にこれを「損失関数の最小化」としてモデル化するため、これは「統計と関係があります」;)
ファビオベルトラミニ

5

ニュートリノは光よりも速くないとCERNが判断したため、ニュートリノの変化に気付く前に、電磁放射の衝撃波が地球に衝突します。これは、少なくとも(非常に短期的に)壮観なオーロラ効果を持つでしょう。したがって、それが暗いという事実は、空が明るくなるのを妨げません。月が過度に明るく輝いていること(ラリーニヴェンの「Inconstant Moon」を参照)と、人工衛星が気化して自己燃焼したときの壮大な閃光。

すべてのすべて-おそらく間違ったテスト?(そして、以前はあったかもしれないが、事後の現実的な決定のための時間は不十分だろう。


1
それから、太陽が爆発したという仮説を拒否するより多くの理由。:-)
シュリーバツァー

それで、著者が「確認的研究が必要」と言うとき、これは記事の終わりに意味されますか?
DWin

実際、これについては、タイトルに明確な推論があります。マシン、太陽が新星になったかどうかを検出します。検出にエラーの可能性はありません。ニュートリノビットは無関係です。それを考えると、統計は、マシンが「いいえ」、「いいえ」、「いいえ」と応答するようなものです...統計を終了する1回限りのイベントまで、偽のステートメントである可能性が1/36あります(はい)プロセスが発生する- 地球上で明らかになるのにかかる奇数の8分間隔の間にマシンが照会された場合、これは誤って報告される可能性が1/36にもなります(いいえ)。
SimonN

4

私は@GeorgeLewisに同意します。頻度論的アプローチは間違っていると結論付けるのは時期尚早かもしれません。ニュートリノ検出器をさらに数回再実行して、より多くのデータを収集しましょう。事前問題をいじる必要はありません。


2

ここでのすべての詳細な回答の中で失われる可能性のある簡単な点は、頻度の高い人が単一のサンプルに基づいて結論を出していることです。実際には、これを行うことはありません。

有効な結論に達するには、統計的に有意なサンプルサイズが必要です(言い換えれば、科学は再現可能である必要があります)。そのため、実際には、フリークエンティストはマシンを複数回実行し、結果のデータについて結論を出します。

おそらくこれは、マシンに同じ質問をさらに数回尋ねることを伴うでしょう。そして、マシンが間違っている場合、おそらく36回のうち1回だけ明確なパターンが現れます。そして、そのパターンから(1回の読み取りからではなく)頻度論者は、太陽が爆発したかどうかに関して(かなり正確な、私が言うでしょう)結論を導き出します。


4
「統計的に有意なサンプルサイズ」とはどういう意味ですか?
モモ

@Momo-単一のサンプル以上、それは確かです。ありそうもない結果を観察し、最初に観察を繰り返さずにありえないことが起こったと結論付けて、それがまぐれではないことを確認することは無効です。統計的に有意なサンプルサイズを表す正確な数値または正確な数値を決定するアルゴリズムが必要な場合は、おそらく統計学者が提供できます。しかし、私は統計学者ではありません。
アロス

3
サンプルサイズが1であることに特別な問題はないと思います。問題は、検定に統計的検出力がないことです(つまり、偽の場合、検定は帰無仮説を決して拒否しません)。ただし、この記事では、記事で「ヌルの儀式」が暴走し、統計力(およびH1が実際に何であるか、または問題に関連する事前情報)の問題を無視しているという問題を明らかにしています。
ディクランマースピアル

1
@Dikranそれは可能な限り最高の答えの一つです!漫画の「頻度論者」の問題は、テストの特性の必要な評価を最初に行わずに特定の統計的儀式が守られていることです。(この決定に関連する損失関数がどうあるべきかを検討することで、分析を拡張することさえできます。)このように、漫画は、統計手順を理解または仮定を確認せずに統計手順を採用するすべての人々をきちんと串刺しにします。
whuber

2

あなたの質問に対する答え:「彼は頻繁な方法論を正しく適用していますか?」いいえ、彼は頻繁なアプローチを正確に適用していません。この問題のp値は、正確に1/36ではありません。

最初に、関係する仮説が

H0:太陽は爆発していません。

H1:太陽が爆発しました。

次に、

p値= P( "マシンはyesを返します" | Sunは爆発していません)。

この確率を計算するには、「マシンがyesを返す」は「ニュートリノ検出器が太陽の爆発を測定し、真の結果を伝える、またはニュートリノ検出器が太陽の爆発を測定せず、私たちに嘘をつく」と同等であることに注意する必要があります。

サイコロの投げがニュートリノ検出器の測定値に依存しないと仮定すると、以下を定義することでp値を計算できます。

p0 = P(「ニュートリノ検出器は太陽の爆発を測定する」|太陽は爆発しなかった)、

次に、p値は

p値= p0 x 35/36 +(1-p0)x 1/36 =(1/36)x(1+ 34 x p0)。

この問題の場合、p値は1/36〜35/36の数値です。p値は、p0 = 0の場合にのみ1/36に等しくなります。つまり、この漫画の隠された前提は、太陽が爆発していなければ、検出機は太陽の爆発を決して測定しないということです。

さらに、アノーバ爆発の外部証拠に関する可能性には、さらに多くの情報を挿入する必要があります。

ではごきげんよう。


1

私は、頻度主義者のアプローチには何の問題も見ていません。帰無仮説が棄却された場合、p値はタイプ1エラーの確率です。タイプ1エラーは、真の帰無仮説を拒否しています。この場合、p値は0.028です。これは、これまで実施されたこのp値を使用したすべての仮説検定の中で、100のうち約3が真の帰無仮説を棄却することを意味します。構造上、これはそれらのケースの1つです。多くの場合、真の帰無仮説を拒否したり、偽の帰無仮説(タイプ2エラー)を保持したりすることを頻繁に受け入れます。さらに、彼らは長期的に誤った推論の頻度を正確に定量化します。

おそらく、この結果を見るのにそれほど混乱しない方法は、仮説の役割を交換することです。2つの仮説は単純なので、これは簡単です。nullが太陽が新星になったことである場合、p値は35/36 = 0.972です。これは、これは太陽が新星になったという仮説に対する証拠ではないことを意味するため、この結果に基づいてそれを拒否することはできません。これはより合理的なようです。あなたが考えているなら。なぜ太陽が新星になったと思うのでしょうか?お願いします 太陽が爆発するという考えがばかげているように思えるのに、なぜ誰もそのような実験を行うのでしょうか?

これは、実験の有用性を事前に評価する必要があることを示しているだけだと思います。たとえば、この実験は、空を見上げただけですでにわかっていることをテストするため、まったく役に立ちません(これは、事実上ゼロのp値を生成するはずです)。優れた実験を設計することは、優れた科学を生み出すための要件です。実験の設計が不十分である場合、使用する統計的推論ツールに関係なく、結果は有用ではありません。


確かに、しかし、ベイジアンは、与えられたデータ/実験結果で合理的な結論を推測できます。場合によっては、実験を繰り返したり、思い通りに設計したりすることはできません。
アメリオバスケスレイナ14

それは公平な点であり、ベイジアン推論は以前の経験を簡単に取り入れることができ、異常な結果が統計的な重みを持つことを難しくします(統計的な悪用から私たちを保護します)。ただし、これはベイジアンフレームワークでは役に立たない実験でもあります。事前の結果は非常に強く1つの結論に賛成しているため、この実験の結果はそれを変更できません。事前が非常に強い場合。修正する機会なしに実験を行うのはなぜですか?弱い事前分布(データによって変更される可能性が高い)を検討する場合、ベイジアン法と周波数法は通常「同等の」結果をもたらすと思います。
ホセガルミラ14

0

太陽熱安定性に関する「事前知識」を頻繁な方法論に統合するには?

非常に興味深いトピック。

完全な分析ではなく、いくつかの考えを示します...

情報量の少ない事前確率でベイジアンアプローチを使用すると、通常、頻度の高いものに匹敵する統計的推論が提供されます。

なぜベイジアンは太陽が爆発しなかったという強い事前の信念を持っているのですか?なぜなら、彼は皆が太陽が最初から爆発したことがないことを知っているからです。

共役事前分布使用したいくつかの簡単な統計モデルでは、事前分布を使用することは、非情報的事前および予備実験から導出された事後分布を使用することと同等であることがわかります。

上記の文は、予備実験の結果をモデルに含めることにより、頻度論者がベイジアンであると結論付ける必要があることを示唆しています。これが、ベイジアンが実際に行っていることです。彼の事前経験は、予備実験の知識から来ています!

Nxiixiθxixi=1i=1,,N

N+1xiy={Yes}θ θ X 1··· XのN個の Y 1 N Y = { はい} θ θPr(xN+1=0)θθx1,,xNy1Ny={Yes}θ。そして、ベイジアンはについての事前の分布を通してこの情報を反映するつもりです。θ

この観点から、仮説検定の観点から質問を言い換える方法はわかりません。を取ることは意味がありそれは私の解釈では実験の問題であり、真/偽の仮説ではないからです。たぶんこれはフリークエンティストの誤りでしょうか?H0={the sun has not exploded}


「...彼は皆が太陽が始まって以来爆発したことがないことを誰もが知っている」という文章は、数百万の七面鳥(Meleagris gallopavo)が消費される最近のアメリカの休日についての物語を思い起こさせます。時間が経つにつれて、インテリジェントな七面鳥は毎日、11月中旬の運命的な(そして彼女にとってはまったく予想外の)日まで、彼女が食べられ、世話されることを「みんなとして知っている」のです。同様に、太陽の安定性に対する信頼は、人間の観測の比較的短い歴史だけに頼らなければならなかった場合、低いはずです。
whuber

@whuberこのメッセージを非公開で送信したいと思います。あなたのコメントと議論のトピックの間には関係がありますか?私がアイデアを生み出すのは私なのかどうかはわかりませんが、主に私の答えに対して何かを言うためにあなたが私の答えにコメントしていると感じることは何度もあります。OPが提示する演習は漫画の解釈であり、実際の問題について話しているかのように私の答えを批判していると感じています。最近、私は感謝しませんでしたし、あなたが私の答えの背後にある可能性のある「意図」を引き起こした理由をまだ理解していません。
ステファンローラン

暗示的または意図的な批判はありませんでした:時にはコメントは本当に...コメントです。重要な質問を(ユーモラスになるように)強調表示しようとしましたが、回答では示唆されていませんでした。あなたがこれを個人的または攻撃のいずれかとして認識することを残念に思います。ところで、これ本当の質問です。「事前知識」をどのように統合するかを尋ねます。この質問は、ヒュームの帰納的推論に対する批判を呼び起こし、科学の哲学の問題と統計のまさに基礎になります。慎重に検討する価値があります!
whuber

あなたの評判のかなりの部分があなたの答えに対する私の投票によるものであることも指摘する価値があるかもしれません-私はあなたに対する私の側に体系的な行動がないという重要な証拠として提供します
whuber

2
いいえ、あなたのコメントを理解しました。あなたのコメントのフランス語のGoogle翻訳はすでに奇妙ですが、英語のスキルと奇妙なGoogle翻訳を組み合わせることで、正しい翻訳を得ることができます。来月はもっとリラックスするでしょう。
ステファンローラン

0

もちろん、これは頻繁な0.05レベルのテストです-帰無仮説は、帰無仮説の下で5%未満の時間拒否され、代替の下での力さえも大きいです。

一方、事前の情報は、特定の時点で超新星に行く太陽はかなりありそうにないが、偶然に嘘をつく可能性が高いことを教えてくれます。

結論:コミックには何も問題はありません。信じがたい仮説をテストすると、誤検出率が高くなることがわかります。さらに、提供された賭けの評価では、おそらく事前の情報を考慮したいと思うでしょう。そのため、意思決定分析と組み合わせたベイジアン事後分析が非常に人気があります。


-2

私の見解では、より正確な頻度分析は次のようになります。H0:太陽が爆発し、機械が真実を語っています。H1:太陽は爆発せず、機械は横たわっています。

ここでのp値は= P(sunexplosed)です。p(マシンは真実を語っています)= 0.97。P(太陽が爆発した)

統計学者は、2番目の確率の性質を知らずに何も結論付けることはできません。

星のような太陽は超新星に爆発しないため、P(太陽の爆発)は0であることがわかっています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.