ウィキペディアのページには、可能性と確率が明確な概念であると主張しています。
非技術用語では、「可能性」は通常「確率」の同義語ですが、統計的な使用法では、明確な区別があります。観察された結果が与えられたパラメータ値のセットの尤度。
誰かがこれが何を意味するのか、より現実的な説明を与えることができますか?さらに、「確率」と「可能性」がどのように一致しないかを示す例もあります。
ウィキペディアのページには、可能性と確率が明確な概念であると主張しています。
非技術用語では、「可能性」は通常「確率」の同義語ですが、統計的な使用法では、明確な区別があります。観察された結果が与えられたパラメータ値のセットの尤度。
誰かがこれが何を意味するのか、より現実的な説明を与えることができますか?さらに、「確率」と「可能性」がどのように一致しないかを示す例もあります。
回答:
答えは、離散確率変数を扱うか連続確率変数を扱うかによって異なります。したがって、それに応じて答えを分割します。技術的な詳細が必要であり、必ずしも平易な英語での説明が必要ではないと想定します。
離散確率変数
離散値(たとえば、コインを10回投げた結果、10分以内に店舗に到着した顧客の数など)を取る確率的プロセスがあるとします。このような場合、基礎となる確率過程について適切な仮定を行うことにより、特定の結果セットを観察する確率を計算できます(たとえば、コインの着陸ヘッドの確率はあり、コインのトスは独立しています)。
による観測結果と、確率過程をとして記述するパラメーターのセットを示します。したがって、確率について話すときは、を計算します。言い換えると、に特定の値が与えられた場合、は表される結果を観察する確率です。
ただし、実際の確率過程をモデル化する場合、がわからないことがよくあります。を観察するだけで、目標は、観察された結果Oが与えられた場合にもっともらしい選択となる推定値に到達することです。θの値が与えられた場合、Oを観測する確率はP (O | θ )であることがわかります。したがって、「自然な」推定プロセスは、実際にOを観測する確率を最大化するθの値を選択することです。つまり、次の関数を最大化するパラメーター値θを見つけます。
は、尤度関数と呼ばれます。定義により、尤度関数は観測されたを条件とし、未知のパラメーター関数であることに注意してください。
連続ランダム変数
継続的な場合、状況は似ていますが、1つの重要な違いがあります。連続的なケースではP (O | θ )= 0であるため、θを与えられたを観測した確率についてはもはや話すことができません。技術を習得することなく、基本的な考え方は次のとおりです。
アウトカムに関連した確率密度関数(pdf)を示す:として。したがって、連続的なケースでは、次の関数を最大化することにより、観測結果与えられた場合のを推定します。
この状況では、観測結果関連付けられたPDFを最大化する際に、を観測する確率を最大化するパラメーター値を見つけていると技術的に断言することはできません。
これは、ほぼ全員が答えようとしている種類の質問であり、私はすべての答えが良いと期待しています。しかし、あなたは数学者であるダグラスですので、数学的な回答をさせてください。
統計モデルは、2つの別個の概念エンティティを接続する必要があります。データ(ベクトル空間など)の要素と、データ動作の可能な定量モデルです。モデルは通常、有限次元多様体、境界のある多様体、または関数空間上の点で表されます(後者は「ノンパラメトリック」問題と呼ばれます)。
データは、関数Λ (x 、θ )によって可能なモデル接続されます。任意の所与のためθ、Λ (Xは、θ )の確率(または確率密度)であることが意図されているXを。一方、任意のxについて、Λ (x 、θ )はθの関数として見ることができ、通常、連続的な2次微分可能などの特定の優れた特性を持つと想定されます。Λを表示する意図このようにして、これらの仮定を呼び出すことは、「可能性」と呼ぶことによって発表されます。
それは微分方程式の変数とパラメーターの区別によく似ています:時には解を研究したい(つまり、引数として変数に焦点を合わせたい)ときどき、解がパラメーターによってどのように変化するかを研究したい場合があります。主な違いは、統計では、両方の引数セットの同時変動を調べる必要はほとんどないということです。データとモデルパラメーター両方の変更に自然に対応する統計オブジェクトはありません。そのため、このような二分法については、類似の数学的設定で聞くよりも多く聞くことになります。
すでにいくつかの優れた数学的な説明があるので、説明で数学を最小化しようとします。
ロビンギランドが指摘するように、確率と尤度の差は確率と統計の差に密接に関連しています。ある意味で、確率と統計は、互いに反対または逆の問題に関係しています。
コイントスを検討してください。(私の答えはWikipediaの例1に似ています。)コインが公正()であることがわかっている場合、一般的な確率の質問は次のとおりです。答えはP (H H )= P (H )× P (H )= 0.5 × 0.5 = 0.25です。
典型的な統計上の質問は次のとおりです。コインは公正ですか?これに答えるには、次の点を尋ねる必要があります。サンプルは、という仮説をどの程度サポートしていますか?
最初に注意する点は、質問の方向が逆になったことです。確率では、仮定されたパラメーター()から開始し、特定のサンプル(2つのヘッドが連続する)の確率を推定します。統計では、観測(連続する2つのヘッド)から開始し、パラメーター(p = P (H )= 1 − P (T )= 1 − q)について推論します。
ウィキペディアの例1は、Pの最尤推定、2つの連続したヘッドの後の(H )が p M L E = 1であることを示しています。しかし、データが真のパラメーター値 p (H )= 0.5を排除することは決してありません(現時点では詳細については気にしません)。実際、 n = 2の後、 p (H )、特に p (H )= 0の非常に小さな値のみを合理的に除去できます。(コインの2つのスロー)。3番目のスローがテールになった後、(つまり、双頭コインではない)の可能性を排除できますが、その間のほとんどの値はデータによって合理的にサポートできます。(p (H )の正確な二項95%信頼区間は0.094から0.992です。
100回コインを投げ、(たとえば)70個のヘッドを置いた後、コインが実際には公平ではないという疑いの合理的な根拠が得られました。の正確な95%CI は0.600から0.787になり、p (H )= 0.5が与えられた100回のトスから70以上の頭(または尾)の極端な結果を観測する確率は0.0000785です。
尤度計算を明示的に使用したことはありませんが、この例では尤度の概念を捉えています。尤度とは、サンプルがパラメトリックモデルのパラメーターの特定の値をサポートする程度の尺度です。
フィッシャーに由来する尤度理論の観点からの視点を提供します-そして、引用されたウィキペディアの記事の統計的定義の基礎です。
パラメーター化された分布F (X ; θ )から生じるランダム変量があるとします。ここで、θはFを特徴付けるパラメーターです。その後の確率次のようになります。 P (X = X )= F (X 、θ )、既知で θ。
多くの場合、データあり、θは不明です。仮定されたモデルFが与えられると、尤度は観測データの確率としてθの関数として定義されます:。Xは既知ですが、θは不明であることに注意してください。実際、尤度を定義する動機は、分布のパラメーターを決定することです。
単純に確率関数を書き直したように見えますが、これの重要な結果は、尤度関数が確率の法則に従っていないことです(たとえば、[0、1]区間にバインドされていません)。ただし、尤度関数は観測データの確率に比例します。
この可能性の概念は、実際には異なる考え方の「尤度主義者」(頻度主義者やベイジアン主義者とは異なる)につながり、さまざまな歴史的議論をすべて検索することができます。基礎となるのは、尤度関数から直接推論を実行できると本質的に言う尤度原理です(確率に基づく推論ではないため、ベイジアンも頻度論者もこれを受け入れません)。最近では、学校で「周波数主義者」として教えられているものの多くは、実際には周波数主義者と尤度思考の融合です。
より深い洞察のために、良いスタートと歴史的参照はエドワーズの尤度です。現代のテイクについては、Richard Royallの素晴らしいモノグラフ、Statistical Evidence:A Likelihood Paradigmをお勧めします。
上記のすばらしい技術的な答えをすべて考えて、言葉に戻してみましょう。確率は(結果の)予想を定量化し、尤度は(モデルで)信頼を定量化します。
誰かが「収益性の高いギャンブルゲーム」に挑戦しているとします。次に、確率は、期待される利益と損失のプロファイル(平均、モード、中央値、分散、情報比率、バリューアットリスク、ギャンブラー破滅など)を計算するのに役立ちます。対照的に、尤度は、そもそもこれらの確率を信頼するかどうかを定量化するのに役立ちます。または「ネズミの匂い」かどうか。
ちなみに、上記の誰かが統計の宗教について言及したので、尤度比はベイジアン世界と頻度の高いものの不可欠な部分であると信じています:ベイジアン世界では、ベイズの公式は単に事後を生成する可能性と事前に結合します。
頭を着陸させる確率が、尾を着陸させる確率がコインがあるとします。ましょうヘッドを示し、尾を示しています。次のようにを定義します
指定されたxの確率であり、、の可能性である所与。基本的に、尤度と確率は、密度のどのパラメーターが変数と見なされるかを示します
公正なコイン(パラメーター値)がある場合、頭に浮かぶ確率は0.5です。コインを100回裏返し、52回頭に上がった場合、公平である可能性が高くなります(可能性の数値はさまざまな形をとる可能性があります)。
は、2つの観点から見ることができます。
多くの場合、この式はまだ両方の引数の関数であるため、むしろ強調の問題です。
私に関する限り、最も重要な違いは、尤度は()確率ではないということです。
推定問題では、Xが与えられ、尤度 はθではなくXの分布を表します。つまり、∫ P (X | θ )のD θは可能性がのPDFファイルではないので、無意味であるθそれが特徴づけるんが、θをある程度まで。