ベイジアンとフリークエンティストの推論を区別する特徴を、平易な英語でどのように説明しますか?
ベイジアンとフリークエンティストの推論を区別する特徴を、平易な英語でどのように説明しますか?
回答:
おばあちゃんとの基本的な違いを説明する方法を次に示します。
電話を家のどこかに置き忘れました。楽器の底面にある電話ロケーターを使用して電話を見つけ、電話ロケーターを押すとビープ音が鳴り始めます。
問題:自宅のどのエリアを検索する必要がありますか?
電話のビープ音が聞こえます。また、音が発生している領域を特定するのに役立つメンタルモデルもあります。したがって、ビープ音が聞こえたら、自宅のエリアを推測して、電話を見つけるために検索する必要があります。
電話のビープ音が聞こえます。今では、音の発信元を特定するのに役立つメンタルモデルとは別に、過去に電話を置き忘れた場所も知っています。そのため、ビープ音と過去に電話機を置き忘れた場所に関する以前の情報を使用して推論を組み合わせ、電話機を見つけるために検索する必要がある領域を特定します。
頬の舌をしっかりと:
ベイジアンは、ほとんどの非統計学者が行うのとまったく同じ方法で「確率」を定義します。つまり、命題または状況の妥当性を示します。あなたが彼に質問をすると、彼はあなたに特定の状況で起こりうる結果の妥当性を説明する(そして彼の以前の仮定を述べる)確率を割り当てる直接の答えを与えます。
頻度論者は、確率がイベントが発生する長期的な頻度を表すと信じている人です。必要に応じて、彼はあなたの特定の状況をランダムなサンプルと見なすことができる架空の集団を発明し、長期的な頻度について有意義に話せるようにします。特定の状況について質問した場合、彼は直接答えるのではなく、この(おそらく想像上の)集団について声明を出します。多くの非頻度統計学者は答えによって簡単に混乱し、特定の状況に関するベイズ確率としてそれを解釈します。
ただし、ほとんどの頻度論的手法には、ほとんどの状況で本質的に同じ結果が得られるベイジアン等価物があり、違いは主に哲学の問題であり、実際には「コースの馬」の問題であることに注意することが重要です。
ご想像のとおり、私はベイジアンおよびエンジニアです。; o)
非常に大雑把に言って:
フリークエンティスト:サンプリングは無限であり、決定ルールはシャープにすることができます。データは反復可能なランダムサンプルです-頻度があります。基礎となるパラメータは固定されています。つまり、この繰り返し可能なサンプリングプロセス中は一定のままです。
ベイジアン: 未知の量は確率的に扱われ、世界の状態は常に更新できます。実現されたサンプルからデータが観察されます。パラメーターは不明であり、確率的に説明されています。修正されるのはデータです。
ベイジアンとフリークエンティストが同じ問題にどのように取り組むかについての詳細な例を提供する素晴らしいブログ投稿があります。自分で問題に答えてからチェックしてみませんか?
問題(Panos Ipeirotisのブログから引用):
コインを持っていると、フリップすると確率pで頭になり、確率1-pで尾になります。(pの値は不明です。)
pを推定しようとすると、コインを100回裏返します。それは71回頭になります。
次に、次のイベントを決定する必要があります。「次の2回のトスで、2つのヘッドを連続して取得します。」
あなたは、イベントが起こるか、起こらないと賭けますか?
男が6面のサイコロを振って、結果が1、2、3、4、5、または6であるとしましょう。さらに、3が出たら、無料のテキストブックを提供すると言います。
次に、非公式:
Frequentistは、各結果が生じるの等しい1 6チャンスを有することを言います。彼女は、確率を長期の頻度分布から導き出したものと見なしています。
しかし、ベイジアンはちょっと待ってと言うでしょう、私はその男を知っています、彼は有名なトリックスターのデビッド・ブレインです!私は彼が何かをしていると感じています。私は3の上に着陸、それのわずか1%の確率があることを言うつもりです しかし 、私は彼がダイスを振り回以上そのbeliefeを再評価し、それを変更します。他の数字が同じくらい頻繁に表示される場合は、チャンスを1%から少し高い値に繰り返し増やします。それ以外の場合はさらに減らします。彼女は確率を命題の信念の程度と見なします。
ちょっとした楽しみ...
このサイトから:
http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html
同じサイトからの素敵なエッセイ...
「ベイズの定理の直観的な説明」
ベイジアンは賭けをするよう求められます。これには、ハエが壁をより速くい出して、薬がほとんどの命を救うか、囚人が刑務所に行くかが含まれます。彼はハンドル付きの大きな箱を持っています。彼は、彼の個人的な意見を含め、彼が知っていることを完全に箱に入れて、ハンドルを回せば、それが彼にとって最良の決定を下すことを知っています。
頻繁にレポートを作成するよう依頼されます。彼はルールの大きな黒い本を持っています。報告するよう求められた状況がルールブックでカバーされている場合、彼はルールに従って、最悪の場合は100回に1回(または20回に1回、または1回彼の報告書の仕様書に記載されているとおりに時間をかけてください)。
頻度の高い人は、(彼はそれについて報告書を書いているので)ベイジアンは時々、最悪の場合、彼の個人的な意見が間違っているとき、ひどく結果が出るかもしれないという賭けをすることを知っています。頻度の高い人は、同じ理由で、彼とは異なるたびにベイジアンに賭けた場合、長期的には負けることを知っています。
平易な英語で言えば、ベイジアンとフリークエンティストの推論は、質問に答える2つの異なる方法によって区別されると言えます。
確率とは何ですか?
基本的に理論の有効なアプリケーションのドメインを定義するため、ほとんどの違いは基本的にそれぞれがこの質問にどのように答えるかによって決まります。質問をさらに生成せずに、「平易な英語」の観点からどちらの答えも実際に与えることはできません。私にとっての答えは(おそらく推測できるように)です
確率は論理です
。さらに、確率の計算は命題の計算から導出できます。これは、「ベイジアン」推論に最も厳密に準拠しています。ただし、確率を割り当てる原則に加えて、それらを操作する原則を提供することにより、アプリケーションのベイジアン推論を拡張します。もちろん、これは「論理とは何か」という質問につながります。私にとって、この質問に対する答えとして私ができる最も近いものは、「論理とは、与えられた仮定のセットを持つ合理的な人の常識的な判断です」(合理的な人とは何かなど)です。ロジックには、ベイジアン推論と同じ機能がすべて備わっています。たとえば、ロジックは何を仮定するか、または「絶対に正しい」ことを教えません。それは、ある命題の真理が他の命題の真理とどのように関係しているかをあなたに伝えるだけです。結論に着手するには、論理システムに「軸」を常に提供する必要があります。矛盾する公理から任意の結果を得ることができるという点でも、同じ制限があります。しかし、「軸」は、事前に設定された確率に他なりません。
頻繁な推論については、答えがあります。
確率は頻度です
「頻度」は、ここで使用されている意味でわかりやすい英語の用語であるかどうかはわかりませんが、おそらく「割合」がより良い言葉です。私は、イベントの確率は、それを計算している人/オブジェクトとは無関係に存在する、実際の測定可能な(観測可能な?)量であると考えられるというフリークエンティストの答えに加えたかったのです。しかし、私はこれを「普通の英語」の方法で行うことはできませんでした。
おそらく、違いの1つの「平易な英語」バージョンは、頻繁な推論が「絶対」確率から推論する試みであるのに対し、ベイジアン推論は「相対」確率から推論する試みである可能性があります。
もう1つの違いは、現実世界の問題を理論の抽象的な数学にどのように変換するかについて、頻度主義の基礎がより曖昧であることです。良い例は、理論における「ランダム変数」の使用です。数学の抽象的な世界では正確な定義がありますが、観測された量が「ランダム」であるかどうかを決定するために使用できる明確な手順はありません変数"。
ベイズの推論の方法、「ランダム変数」の概念は必要ありません。確率分布は不明であるため、量に割り当てられます。つまり、私たちが持っている情報から論理的に推定することはできません。これにより、観測可能な量と理論の間の単純な接続がすぐに提供されます-「不明であること」は明白です。
上記の例では、これら2つの考え方-「ランダム」と「不明」のさらなる違いも見ることができます。「ランダム性」は、「ランダム性」が実際の量の特性のように見えるように表現されます。逆に、「不明」は、その量について尋ねている人によって異なります。したがって、分析を行う統計学者の特性です。これにより、各理論にしばしば付随する「客観的」対「主観的」形容詞が生まれます。同じ量について異なる情報を与えられた2人の頻度論者に「ランダム」かどうかを判断するように単純に求めることで、「ランダム性」が標準的な例のプロパティになり得ないことを示すのは簡単です。1つは通常のベルヌーイウルンです。一方、フリークエンティスト2は骨urの上に立っており、フリークエンティスト1が骨nからボールを引くのを見ています。「ランダム性」の宣言が骨ballsの中のボールの特性である場合、それは頻度論者1と2の異なる知識に依存することはできません。したがって、2つの頻度論者は「ランダム」または「ランダムではない」 。
現実には、この問題を取り巻く哲学の多くはただのスタンディングだと思います。それは議論を却下することではありませんが、注意の言葉です。時には、実際的な問題が優先されることがあります-以下に例を示します。
また、3つ以上のアプローチがあることも簡単に議論できます。
先輩は最近frequentistとベイズについての共通言語話の多くの人々 」ということを思い出した。私はより多くの有効な区別は可能性をベースとfrequentistだと思います。最尤とベイズ法の両方が付着する可能性の原則 frequentist方法がないのに対し。 」
まず、非常にシンプルで実用的な例から始めましょう。
そのため、テストは、患者が健康であるか病気であるかに応じて、100%正確または95%正確です。総合すると、これはテストが少なくとも95%正確であることを意味します。
ここまでは順調ですね。これらは、頻繁に行われることになるステートメントです。これらのステートメントは非常に理解しやすく、真実です。「頻度の高い解釈」について悩む必要はありません。
しかし、物事を好転させると物事は面白くなります。テスト結果を考えると、患者の健康について何を学ぶことができますか?検査結果が陰性であれば、偽陰性がないため、患者は明らかに健康です。
ただし、テストが陽性の場合も考慮する必要があります。患者が実際に病気だったため、テストは陽性でしたか、それとも偽陽性でしたか?これは、頻度主義者とベイジアンが分岐する場所です。現時点ではこれに答えることができないことに誰もが同意するでしょう。頻繁に回答することは拒否します。ベイジアンはあなたに答えを提供する準備ができていますが、ベイジアンに最初に事前に与える必要があります-すなわち、患者の何パーセントが病気であるかを伝えます。
要約すると、次の文が当てはまります。
そのようなステートメントに満足している場合は、頻繁な解釈を使用しています。これは、見ている問題の種類に応じて、プロジェクトごとに変わる可能性があります。
ただし、別のステートメントを作成して、次の質問に答えたい場合があります。
これには、事前のベイジアンアプローチが必要です。また、これは医師にとって関心のある唯一の質問であることに注意してください。医師は、「患者が肯定的な結果または否定的な結果を得ることがわかっている。また、否定的な結果は、患者が健康で帰宅できることを意味する。今私が興味を持っている患者は肯定的な結果-彼らは病気ですか?」
要約すると、このような例では、ベイジアンは頻繁に発言するすべてのことに同意します。しかし、ベイジアンは、頻度は高いが頻度は高いが、あまり有用ではないと主張するだろう。また、有用な質問には事前にしか答えられないと主張します。
周波数専門家は、パラメーターの可能な値(HまたはS)を順番に検討し、「パラメーターがこの値に等しい場合、テストが正しい確率はどれくらいですか?」と尋ねます。
代わりに、ベイジアンは、可能性のある各観測値(+または-)を順番に検討し、「その値を観測したと想像すると、H対Sの条件付き確率について何がわかりますか?」
For sick patients, the test is NOT very accurate.
NOTを忘れるということですか?
ベイジアン統計と頻度統計は、過去の出来事と仮定モデルに基づいて将来の出来事の確率を評価する2つの制限的なケースとして理解できるという点で互換性があります。システムはそのままであり、この意味で非常に多くの観測値はモデルのパラメーターを知ることと同じです。
10回のコインフリップの結果など、いくつかの観測を行ったとします。ベイジアン統計では、観測したものから始めて、将来の観測またはモデルパラメーターの確率を評価します。頻繁な統計では、何回も投げた場合、コインに偏りがなく、50%のヘッドアップが得られるなど、多数の観測のシナリオを想定することにより、真実の考え(仮説)から始めます。多数の観測(=仮説)のこれらのシナリオに基づいて、あなたがしたように観測を行う頻度、つまり10コインフリップの異なる結果の頻度を評価します。その場合にのみ、実際の結果を取得し、それを可能な結果の頻度と比較し、結果が高頻度で発生すると予想されるものに属するかどうかを判断します。これが当てはまる場合、行われた観察がシナリオと矛盾しないと結論付けます(=仮説)。それ以外の場合、行われた観察はシナリオと互換性がないと判断し、仮説を拒否します。
したがって、ベイジアン統計は観察されたものから始まり、可能な将来の結果を評価します。頻繁な統計は、何かを仮定した場合に観察されるものの抽象的な実験から始まり、その後、抽象的な実験の結果を実際に観察されたものと比較します。それ以外の場合、2つのアプローチは互換性があります。どちらも、行われたまたは仮定されたいくつかの観測に基づいて、将来の観測の確率を評価します。
私はより正式な方法でこれを書き始めました:
ベイジアン推論を頻繁な推論の特定のアプリケーションとして位置づけ、逆も同様です。figshare。
http://dx.doi.org/10.6084/m9.figshare.867707
原稿は新しいです。あなたがそれを読んで、コメントを持っているなら、私に知らせてください。
私は彼らがさまざまな方法で確率を見ると言うでしょう。ベイジアンは主観的であり、先験的な信念を使用して、未知のパラメーターの可能な値に関する事前確率分布を定義します。そのため、彼はdeFinettiのような確率論に依存しています。頻度の高い人は、観測された割合に基づいて、頻度を制限することに関係するものとして確率を考えます。これは、コルモゴロフとフォンミーゼスが開発した確率論と一致しています。
頻度は、尤度関数のみを使用してパラメトリック推論を行います。ベイジアンはそれを取り、事前に乗算し、それを正規化して、推論に使用する事後分布を取得します。
私がこの質問に答える方法は、頻繁に見かける人が見たデータを期待したものと比較することです。つまり、彼らは何かが起こる頻度についてのメンタルモデルを持ち、それからデータとその頻度を確認します。すなわち、彼らが選んだモデルを考えれば、彼らが見たデータはどれくらいありそうか。
一方、ベイジアンの人々は、メンタルモデルを組み合わせます。つまり、以前の経験に基づいて、データがどのように見えると思うかを伝えるモデルを持ち、それを観察データと組み合わせて「後」の信念に落ち着かせます。すなわち、彼らは、彼らが選択しようとするモデルが、観察したデータを与えられて有効である確率を見つけます。
頻度:自然の真の状態はです。このような分析を習慣的に行うと、回答の95%が正解になります。
ベイジアン:95%の確率で真の答えがあります。...私は、あなたが私に与えたデータと、真実が何であるかについての以前の推測の組み合わせに基づいています。
頻度:サイコロに賭けます。サイコロの価値だけが結果を決定します。あなたは賭けに勝つか、そうではありません。チャンスだけに依存します。
ベイジアン:テキサスホールデムポーカーをプレイします。2枚のカードを見るのはあなただけです。あなたはテーブルの他のプレイヤーについてある程度の知識を持っています。フロップ、ターン、リバーで勝つ確率を調整する必要があります。おそらく、残っているプレイヤーに応じて。彼らは頻繁にブラフしますか?彼らは積極的または受動的なプレイヤーですか?このすべてがあなたが何をするかを決定します。あなたが獲得した最初の2つのハンドカードの確率だけでなく、勝つかどうかを決定します。
頻繁にポーカーをプレイするということは、すべてのプレイヤーが最初に手を見せ、フロップ、ターン、リバーのカードが表示される前にベットまたはフォールドすることを意味します。今では、勝つかどうかは再びチャンスにかかっています。
頭痛がして医者に行きましょう 医師の決定セットには、頭痛の2つの原因、脳腫瘍の#1(99%の時間頭痛を引き起こす根本的な原因)、および#2風邪(ごく少数の患者で頭痛を引き起こす可能性のある原因)があるとします。
それから、フリークエンティストのアプローチに基づく医師の決定は、脳腫瘍を持っているでしょう。
ベイジアンアプローチに基づいた医師の決定は、あなたが風邪をひいていると言うでしょう(風邪の1%だけが頭痛を引き起こす場合でも)
オスの猫とメスの猫は、十分な餌と水とともに、70日間鋼の部屋に入れられます。
ネコの平均妊娠期間は66日間で、猫がpenでられたとき雌は発情し、発情したら4から7日間繰り返し交尾するだろうと頻繁に言っています。多くの場合、繁殖行為と妊娠に十分な時間があったため、70日目に箱を開けると、生まれたばかりの子猫が散らかっています。
ベイジアンは、1日目に箱から深刻なマーヴィン・ゲイが来るのを聞いたと言います。そして今朝、箱からたくさんの子猫のような音が聞こえました。そのため、猫の繁殖についてあまり知らなくても、70日目に箱を開けると、生まれたばかりの子猫がたくさんいます。