ベイジアンのように考え、頻度の高い人のように確認してください。それはどういう意味ですか?


35

ここにあるデータサイエンスコースの講義スライドをいくつか見ています。

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

残念ながら、この講義のビデオを見ることができず、スライドのある時点で、プレゼンターには次のテキストがあります。

いくつかの重要な原則

ベイジアンのように考え、周波数主義者のように確認する(和解)

誰がそれが実際に何を意味するか知っていますか?これから集められるべきこれらの2つの考え方について、良い洞察があると感じています。


2
モデル検査と関係があると考えてください。ベイジアンが残差を見ることができない理由を参照してください
Scortchi-モニカの復職

@Scortchi私が収集したことから、これは何らかの方法でトレーニング、検証、テストのデータセットを分離する必要はありません。ここに)。しかし、私はまだ...それはfrequentistのようなチェックによって何を意味するのかに関して、混乱しています
ルカ

1
「適切な」ベイジアンは事前確率を調整せず、ベイズの定理を使用して新しい情報に従って更新するだけです。しかし、私はこの「重要な原則」が何に基づいているのか推測しているだけです。
Scortchi-モニカの復職

4
リンクを読み込めませんでした。私の推測では、ベイジアン法を使用している場合でも、フリークエンティストの動作特性に注意する必要があるということです:95%の信頼できる間隔を生成している場合、それは非常にタイトですが、実際には20%の関心のある真のパラメーターをカバーし、心配する必要がありますか?過度に硬直したベイジアンは「ノー」と言うかもしれません(しかし、そのような硬直のベイジアンは実際にはほとんど存在しません)。
クリフAB

3
将来のスライドを楽しみにして、彼らはEmpirical Bayesを支持しています。これは、次のように見ることができるスライドのセット
クリフAB

回答:


32

確率の解釈の違いにより、ベイジアン統計学と頻度統計学の統計学の主な違いが生じます。ベイジアン確率は、イベントが発生する(または発生した)という個人的な信念に関する記述です。頻出確率は、それらのイベントの数が増加するにつれて、制限内で発生する同様のイベントの割合に関するステートメントです。

私にとって、「ベイジアンのように考える」とは、新しい情報が生じたときにあなたの個人的な信念を更新することを意味し、「頻度の高い人のようにチェックする(または心配する)」ことは、それらの手順が使用される時間にわたって集計された統計的手順のパフォーマンスに関心を持つことを意味し、例:信頼できる間隔の範囲、タイプI / IIエラー率など。


1
ご回答ありがとうございます。私のような素人でも簡潔で効果的です!
ルカ

2
事前の影響を調査したり、情報のないものを使用して、ベイジアンのように確認したり心配したりすることはできませんか?これは逐次分析にのみ適用されますか?ベイジアン統計とフリークエンティスト統計がシーケンシャル分析と交差する場所については多くの仕事があり、「信念の更新」は必須ではなく、シーケンシャル統計はフリークエンシー主義の設定で厳密にすることができます。
AdamO

1
はい、ベイジアンのように心配することは可能です。例えば、事前の影響を調査することです。いいえ、私の答えは逐次分析のみに適用されるわけではありません。つまり、新しい情報が一度に生じる可能性があります。
ジャラドニエミ

15

ベイジアン統計は信念を要約し、頻度主義統計は証拠を要約します。ベイジアンは、確率を信念の程度と見なします。この包括的で生成的な推論は、仮説を立てるのに役立ちます。たとえば、ベイジアンは、宇宙飛行士が実際にそこを旅行してこれを確認できたかどうかにかかわらず、月がグリーンチーズでできているという概念に確率を任意に割り当てることができます。この仮説は、遠くから月が見えるという考えによっておそらくサポートされていますグリーンチーズのような。頻度論者は、ストローマン以上の仮説を単独で想像することも、証拠がある仮説を別の仮説よりも好むと言うこともできません。最尤法でさえ、「観察されたものと最も一致する」統計を生成するだけです。正式には、ベイジアン統計により、枠を超えて考え、データから防御可能なアイデアを提案できます。しかし、これは本質的に厳密に生成される仮説です。

仮説を確認するには、頻度論統計が最適です。実験が適切に行われると、頻繁な統計により、事前調査を回避することで、調査結果に「独立したオブザーバー」または「経験的」コンテキストが提供されます。これは、カールポッパーの科学哲学と一致しています。証拠のポイントは、特定のアイデアを広めることではありません。十分な証拠は、誤った仮説と一致しています。証拠は単に信念を偽造することができます。

事前確率の影響は、一般的に統計的推論のバイアスと見なされます。ご存知のように、私たちは、物事が起こる理由について、非常に多くの理由を補うことができます。心理的に、多くの人々は、私たちの観察者の偏見は、私たちが見るものに本当に重みをつけないようにする脳の事前の結果であると信じています。マザー牧師が砂丘で言ったように、「希望雲観測」。ポッパーはこの考えを厳格にしました。

これは、私たちの時代の最も偉大な科学的実験のいくつかで歴史的に非常に重要でした。例えば、ジョン・スノーは、細心の注意を払ってコレラの流行のための証拠を収集し、コレラがされていることを鋭く結論付けていない道徳的な剥奪によって引き起こされる、との証拠は下水汚染と非常に一致していたことを指摘した:ノート彼はなかったと結論しますこれは、Snowの発見がバクテリアの発見よりも先であり、機械的または病因学的な理解はありませんでした。同様の談話が種の起源にあります。宇宙飛行士が実際に表面に着陸してサンプルを収集するまで、月がグリーンチーズでできているかどうかは実際にはわかりませんでした。その時点で、ベイジアンの後継者は他の可能性に非常に低い確率を割り当てており、頻度の高い専門家はせいぜいサンプルが月塵以外のものと非常に矛盾していると言うことができます。

要約すると、ベイジアン統計は仮説生成の影響を受けやすく、頻繁な統計は仮説確認の影響を受けやすくなります。これらの取り組みでデータを独立して収集することは、現代の統計学者が直面する最大の課題の1つです。


1
答えてくれてありがとう。あなたが言うとき、あなたは何を意味しましたかPlenty of evidence is consistent with incorrect hypotheses
ルカ

2
@Luca一般的な統計の例は交絡に見られるかもしれません。たとえば、「喫煙は青少年の肺機能を改善する」と言うかもしれません。喫煙は、より良い身体活動、より健康的な食欲を促進し、健康的な社会化を促進する刺激剤であると言って、これをさらに合理化することができます。私がデータを収集した場合、彼らは実際に喫煙する青少年がより良い肺機能を持っていることを示します。連想的結論は正しいが、因果関係の結論は間違っている。年長の子供は喫煙する可能性が高いため、この関係は年齢によって混乱します。
AdamO

ありがとうございました!私はこの非常によく書かれた答えから多くを学びました。
ルカ

5

パーCliff ABOPへのコメント、彼らが経験的ベイズの理念に向かっているように、それが聞こえます。ベイズの考え方には3つの主要な考え方があり、経験ベイズはデータから事前分布を推定します。それは引用に正確に準拠していません(これは、ベイズを前もって示し、その後は頻繁に発生するような懸念を意味します)が、Cliff ABの優れたコメントを見逃してはなりません。

また、ベイジアンの学校は、ベイジアンの手続き後に何もチェックする必要がないと考えていました。より現代的な考え方では、事後予測チェックを使用します。おそらく、この種のダブルチェックユアアンサーアプローチは、見積もりが参照しているものです。

また、頻繁な哲学は、データからの推論よりも手順に関係しています。おそらくそれは、引用の意味の手がかりでもあります。


あなたは私の最初のコメントに言及したと思います。そして、私の2番目のコメントは、詳細な調査の後、彼らが非常に明確にEmpirical Bayesに言及していることです。私は実際、この引用が、両方の考え方の利点を検討するというより一般的な呼びかけではなく、単に経験的ベイズの単なる支持であったことに失望しました。しかたがない。
クリフAB

2

このデータサイエンスクラスのコンテキストでは、「頻繁なチェックのようなチェック」の私の解釈は、保留された検証データの予測関数または決定関数のパフォーマンスを評価することです。「ベイジアンのように考える」というアドバイスは、ベイジアンアプローチから導出された予測関数が一般に良い結果をもたらすという意見を表しています。


(悪魔の提唱者を演じる:)なぜベイジアンのアプローチは「良い結果」をもたらし、頻度は高くないのか?
ティム

ベイジアン手法は、アプローチについて規範的です。頻繁な統計は、決定理論の一部として見ることができ、任意の決定関数を評価するためのフレームワークを提供します(ベイジアンまたはいくつかの頻繁な原則に基づいて)最尤法などの特定の方法は、周波数特性が優れているために頻繁に使用されます(たとえば、漸近的に正しいことを行い、他のほとんどの方法よりも速く到達します)。ベイジアン法は、頻繁に使用される可能性がありますが、使用する理由はさまざまです。
DavidR

ベイジアン手法には、決定理論と多くの共通点があります。また、ベイジアン法が頻度主義の文脈で使用できると思いませ(頻度主義の文脈で事前確率を使用するとどう思いますか?)-それはむしろ他の方法です:多くの頻度主義の方法にはベイジアン解釈があります。これについて議論することに意味はないと思います。あなたの発言は物事を少し単純化しすぎていると言っています。
ティム

ベイジアンアプローチについては、フリークエンシー主義的な特性が豊富にあることを証明できます。その意味で、十分なデータがある限り、ベイジアンを行うことは非常に安全です。
DavidR

1
コインフリップでヘッドの確率pを推定したいとします。ベイジアンとして、確率pの事前分布から始めて、いくつかのデータを観察してから、pの事後分布を取得します。pのポイント推定値を作成する必要があり、ポイント推定値として事後分布の平均を使用することを選択します。言いますと、これはデータからポイント推定に進む方法を説明しています。この方法は、頻繁な方法で評価できます。たとえば、偏っていますか?一貫していますか?漸近的に効率的ですか?優先度が関係していたという事実は、それ自体、フリークエンシストに関係するべきではありません。
DavidR

1

「ベイジアンのように考え、頻度の高い人のように確認する」とは、統計の設計と分析におけるアプローチを指しているように聞こえます。私が理解しているように、ベイジアンの考え方には、以前の状況(実験的または統計的に)についての信念が含まれます。 。これらは、以前の研究と仮説に基づいた信念です。頻繁な思考は(介入の)発見を外挿して、これらの結果が再び起こる理論的および実用的な頻度または確率(すなわち、「頻度」)に基づく信頼区間または他の統計を取得します。たとえば、介入後の読み取りスコアは毎分91ワードで、毎分85から97ワードの95%信頼区間があり、これに関連するp値(確率値)は介入前スコアとは異なります。したがって、95%の時間、新しい読書スコアは、介入後1分あたり85〜97ワードになります。したがって、「ベイジアンのように考える」----つまり、理論化、仮説を立て、以前の証拠を見て、 "頻繁に確認する" ----つまり、これらの実験結果がどのくらいの頻度で発生し、介入よりもチャンス。新しいリーディングスコアは、介入後1分あたり85〜97ワードになります。したがって、「ベイジアンのように考える」----つまり、理論化、仮説を立て、以前の証拠を見て、 "頻繁に確認する" ----つまり、これらの実験結果がどのくらいの頻度で発生し、介入よりもチャンス。新しいリーディングスコアは、介入後1分あたり85〜97ワードになります。したがって、「ベイジアンのように考える」----つまり、理論化、仮説を立て、以前の証拠を見て、 "頻繁に確認する" ----つまり、これらの実験結果がどのくらいの頻度で発生し、介入よりもチャンス。


2
あなたの最後の文- 「チェックfrequentistのような」部分は- frequentist設定を行うには、本当に何もしています:ベイズ推定も...我々はそれが「どのように可能性が高い」が発生するために何かを期待する、または「頻度」を教えてくれます
ティム
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.