XKCDの修正ベイズ定理:実際には合理的ですか?


81

これは特定の分析傾向を利用することで有名な漫画からのものですが、実際には数分後に見れば合理的に見えます。誰もがこの「修正ベイズ定理」が何をしているのかを説明してくれますか?



50
@Tschallackaランドールがそれを書いたと思う理由は何ですか?
カスペルド

16
@Tschallackaは、著者のいずれかがランドール自身でない限り、そうではありません。
SQB

しかし、より多くの証拠に直面してその値を更新するために、P(C)にベイズの定理を適用すべきではありませんか?
ヤック

1
にはファセットの追加があるだけだと確信しています。P(C)
イアンマクドナルド

回答:


107

項を 配布すると、 これは、イベント "ベイジアン統計を正しく使用しています"に適用される総確率の法則として解釈できます。したがって、ベイジアン統計を正しく使用している場合は、ベイズの法則(上記の左端)を回復し、そうでない場合は、データを無視し、前を使用します。P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1P(C)],
C=H

これは、ベイジアンが望む結論を裏付ける前に、原則としてベイジアンが調整できるという批判に対する反論であり、ベイジアン統計は、ベイジアン統計が実際に機能する方法ではないと主張するでしょう。

(そして、はい、あなたは私をオタクでスナイプすることに成功しました。私は数学者でも物理学者でもないので、どれだけのポイントが価値があるかわかりません。)


60
上記の式に組み込まれている巧妙なジョークは、ベイジアン統計を正しく使用していない場合、推論は真実から完全に独立しているということです。
クリフAB

25
にぎやかな通りを渡っているときに答えを入力しなかったことを願っています。これには
関与

6
上記carricatured bayesiansのソートは、ベイズ統計学者ではない、彼らはベイジアン弁護士です
はKjetil BはHalvorsenの

4
@CliffAB私はそれを巧妙な冗談か自然の法則と呼ぶかどうかわかりません。
eric_kernfeld

7
@CLiffAB「あなたの事後(この式で計算される)は証拠に依存しない」という意味ですか?
累積

31

信じられないかもしれませんが、このタイプのモデルは非常に深刻な統計モデルで、特にデータフュージョンを扱う場合、つまり、単一のイベントで推論しようとする複数のセンサーからの推論を組み合わせようとする場合にポップアップします。

センサーが誤動作すると、複数のソースからの信号を組み合わせようとするときに行われる推論に大きな偏りが生じる可能性があります。センサーが実際の対象イベントとは無関係にランダムな値を送信しているというわずかな確率を含めることで、この問題に対するモデルの堅牢性を高めることができます。これにより、90個のセンサーが真を弱く示し、1個のセンサーが真を強く示す場合、結論付ける必要がありますABA(つまり、この1つのセンサーが誤発火する事後確率は、他のすべてのセンサーと矛盾することに気付くと非常に高くなります)。故障分布が推定したいパラメーターに依存しない場合、故障である事後確率が高い場合、そのセンサーからの測定値は、対象のパラメーターの事後分布にほとんど影響しません。実際、失敗の事後確率が1の場合は独立です。

これは、推論に関して考慮すべき一般的なモデルですか、つまり、ベイズ統計を行うときにベイズ定理を修正ベイズ定理に置き換える必要がありますか?いいえ。その理由は、「ベイジアン統計を正しく使用する」ことは、実際には単なるバイナリではないということです(または、そうである場合、常にfalseです)。分析には、ある程度の誤った仮定が含まれます。結論がデータから完全に独立するためには(式によって暗示される)、非常に重大なエラーを犯す必要があります。いずれかのレベルで「ベイジアン統計を誤って使用する」分析が真実から完全に独立していることを意味する場合、統計の使用はまったく価値がありません。すべてのモデルは間違っていますが、一部のモデルは有用であり、すべてそうです。


5
センサーの静的故障モードがどちらか一方の極端なものであることを発見できたのは幸運だったと思います。ただし、ノイズスカッシュははるかに困難です。ワイヤがアンテナのように動作しているため、センサーが正しく機能しており、受信した値が間違っていることを発見するのは本当に迷惑です。
ジョシュア

@Joshuaいつかそういう状況でカルマンフィルタリングを適切に学習する時間があることを願っています(または、誰かがすべてを明確にする素晴らしいSEの回答を書くかもしれません)。
mbrig

@ジョシュア:あなたは私よりもはるかに具体的なモデルを考えていると思います。障害の分布を適切に特徴付けることで推論を改善できますが、これらは非常にあいまいな障害の分布の場合に非常に役立ちます。たとえば、パラメータについて推論を行いたい場合、センサー測定値が機能する場合はあるとします。たとえば、が故障しているという小さな確率を含めることができます。センサーが他のすべてのセンサーと強く一致しない場合、故障である事後確率は非常に高くなります。μiN(aiμ,1)t(df=10)i
クリフAB
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.