ウィキペディアの可能性に関するエントリはあいまいに見える


26

「条件付き確率」と「可能性」に関する簡単な質問があります。(私はすでにこの質問をここで調査しましたが、役に立ちませんでした。)

ウィキペディアの可能性に関するページから始まります。彼らはこう言います:

結果与えられたパラメーター値のセットの尤度は、パラメーター値が与えられた場合に観測された結果の確率に等しい、つまりθx

L(θx)=P(xθ)

すばらしいです!そう英語で、私はこれを読んで、「シータ、所与のデータX = X、(左辺)を、等しいパラメータの可能性は、データXがXに等しい確率に等しい所定のパラメータことシータに等しい」。(太字は強調のためのものです)。

ただし、同じページの3行以上後に、Wikipediaのエントリは次のように続きます。

ましょ離散確率分布を持つ確率変数 、パラメータに応じて、。次に、関数Xpθ

L(θx)=pθ(x)=Pθ(X=x),

関数と見なされるものは、(確率変数結果が与えられた場合の)尤度関数と呼ばれます 。時には値の確率のパラメータ値のためのとして書き込まれる多くの場合のように記述を強調するために、このから異なる 条件付き確率されていないので、パラメータとしない確率変数です。θθxXxXθP(X=xθ)P(X=x;θ)L(θx)θ

太字は強調のためのものです)。したがって、最初の引用では、文字通り条件付き確率について説明されていますが、その後すぐに、これは実際には条件付き確率ではなく、実際には?P(xθ)P(X=x;θ)

それで、どれが?尤度は、実際には最初の引用の条件付き確率を暗示していますか?または、2番目の引用の単純な確率を暗示していますか?

編集:

これまでに受け取った有益で洞察に満ちたすべての答えに基づいて、私の質問を要約しました。

  • 英語「可能性が観測されたデータを考えると、パラメータの関数である。」:、我々はと言います で数学:、我々は、のように記述。L(Θ=θX=x)
  • 尤度は確率ではありません。
  • 尤度は確率分布ではありません。
  • 尤度は確率質量ではありません。
  • ただし、英語では、尤度は「であり、パラメーター化された確率分布の積(連続的な場合)、または確率質量の積(離散的な場合)。 " 数学、我々は、次に、そのように書く:(連続ケース、はPDF)、および(離散ケース、は確率質量)。ここで重要なことは、ここではまったくX=xΘ=θL(Θ=θX=x)=f(X=x;Θ=θ)f
    L(Θ=θX=x)=P(X=x;Θ=θ)P 条件付き確率がまったく影響を及ぼします。
  • ベイズの定理では、。口語的には、「が尤度である」と言われますが、は実際のランダム変数。したがって、正しく言うことができるのは、この用語は、尤度に単純に「類似」しているということです。(?)[これについてはよくわかりません。]P(Θ=θX=x)=P(X=xΘ=θ) P(Θ=θ)P(X=x)P(X=xΘ=θ)ΘP(X=xΘ=θ)

編集II:

@amoebasの回答に基づいて、私は彼の最後のコメントを描きました。私はそれが非常に解明されていると思うし、それが私が持っていた主な競合を解消すると思う。(画像上のコメント)。

ここに画像の説明を入力してください

編集III:

@amoebasのコメントをベイジアンのケースに拡張しました。

ここに画像の説明を入力してください


すでに2つの良い答えがありますが、stats.stackexchange.com / q / 112451/35989
ティム

@Tim Excellent linkありがとう!あいにく、私は、尤度に対する特定の質問と、それが想起されると思われる条件付き確率(?)について、まだ不明です。これに関して、私はまだ不明です。:-/
クレアトロン

2
「それを与える」とは、必ずしも条件付き確率を意味するわけではありません。このフレーズは、計算または概念的に修正される予定のシンボルを示すための試みである場合があります。
whuber

2
実際、セミコロンでこのような表記規則を使用している人もいます。下付き、上付きなど、多くの多くの慣習があります。多くの場合、コンテキストまたはそのテキストの説明から誰かが何を意味しているのかを理解する必要があります。
whuber

4
ときθランダム変量(で、ランダム変数から生じると考えられた値ではありません、尤度の変化の定義では何も)。 まだ可能性があります。 論理的には、これは青い蝶がまだ蝶であると言うことに違いはありません。技術的には、Θxの共同分布に関する問題が発生します 明らかに、この共同分布は、条件付き確率で尤度を特定する前に、明確に定義され、特定の「規則性条件」を満たさなければなりません。ΘΘx
whuber

回答:


18

これは主に不必要な毛の分割だと思います。

条件付き確率Xが与えられたyが 2つのランダム変数に定義され、XおよびYの値とるのxおよびyは。しかし、我々はまた、確率について話すことができるP X | θ X与えられたθどこθは確率変数が、パラメータではありません。P(xy)P(X=xY=y)xyXYxyP(xθ)xθθ

両方の場合において同じ用語「所定の」というメモと同じ表記を使用することができます。別の表記法を考案する必要はありません。さらに、「パラメーター」と呼ばれるものと「ランダム変数」と呼ばれるものはあなたの哲学に依存しますが、数学は変わりません。P()

ウィキペディアからの最初の引用は、その述べの定義によると。ここでは、θがパラメーターであると仮定します。二重引用符は、と言っているLθ | xがあるない条件付き確率。これは、xが与えられた場合のθの条件付き確率ではないことを意味します。そして実際には、そうすることはできません。なぜなら、θはここではパラメーターであると想定されているからです。L(θx)=P(xθ)θL(θx)θxθ

ベイズ定理の文脈でabは両方とも確率変数です。しかし、我々はまだ呼び出すことができますPB|(の「可能性」)、そして今でもある善意(の条件付き確率B)。この用語は、ベイジアン統計の標準です。可能性に「似ている」と言う人はいません。人々は単にそれを可能性と呼びます。

P(ab)=P(ba)P(a)P(b),
abP(ba)ab

注1:最後の段落では、は明らかにbの条件付き確率です。尤度としてL| B それはの関数として見られています。ただし!の確率分布(または条件付き確率)ではありません。aに対するその積分は必ずしも1とは限りません。(一方、b上の積分は行います。)P(ba)bL(ab)aaa1b

注2: @MichaelLewによって強調されるように、尤度は任意の比例定数まで定義されることがあります(ほとんどの場合、人々は尤度比に関心があるため)。これは便利ですが、常に行われるわけではなく、必須ではありません。


参照して、「可能性」と「確率」の違いは何ですか?特に@whuberの答えはそこにあります。

このスレッドでの@Timの回答にも完全に同意します(+1)。


1
実際、尤度は、条件付き確率(最後の段落のように)に等しくなる可能性ありますか?これは私が二乗しようとしているものです。たとえば、最初の回答の1つでは、「最初に、尤度は比例定数までしか定義されていないため、尤度はパラメータ値が与えられたデータの確率に一般的に等しくなることはできません。最初の形式化された尤度(フィッシャー、1922)。 "これは私が二乗しようとしているものです。尤度-尤度は条件付き確率と等しくなることはありますか?
クレアトロン

@Creatron回答に2つのメモを追加しました。彼らはそれを明確にしますか?
アメーバは、モニカーを復活させる

1
注1に関して:条件付き確率分布であり、L a | b 確率分布になれないため、次の方程式を書くことができる最も「正しい」方法であるように思われます。この文脈における可能性がある:L | B α P B |、としてではなく、L | B = P B |P(b|a) L(a|b) L(a|b)P(b|a)L(a|b)=P(b|a)。(最適化ではこれが違いを生まないことは知っていますが、可能性がここにあるものの正確さを突き止めようとしています)。私の理解は正しいですか?お待ちいただいてありがとうございます。
クレアトロン

1
@Creatronここでいくつかの明確な問題を混乱させていると思います。あなたはベイズの定理の設定について話していると仮定します(これは私の注1が指すものです)。ここで、bは両方ともランダムなイベントです。さて、P b | a aが与えられbの条件付き確率分布です。しかし、L | bがの関数として見られることになっている、いないのB!そして、それは確率分布ではありませんAabP(b|a)baL(a|b)aba合計しないので。これは、問題または比例関係とは関係ありません(これは私の注2です)。私たちは書くことができると思いL(a|b)=P(b|a)
アメーバは、モニカーを復活させる

1
アメーバ、ありがとう!! あなたは私のためにこれらの概念を解くのに尽力してくれました、ありがとうございました!! :)図をベイジアンの場合に「拡張」しただけであり、それを正しく理解したことを確認するためにフィードバックをお願いします。私もあなたの答えを受け入れました。もう一度、非常に優雅に!
クレアトロン

10

すでに2つの良い答えが得られましたが、まだ不明確に思われるので、1つ提供させてください。尤度は次のように定義されます

L(θ|X)=P(X|θ)=ifθ(xi)

そのため、データXが与えられると、パラメーター値θの可能性があります。これは、θでパラメーター化されたXの確率質量(離散ケース)または密度(連続ケース)関数fの積に等しくなります。尤度は、データが与えられたパラメーターの関数です。ことに注意してくださいθは、我々が最適化されていることをパラメータでありません、それはそれに割り当てられたすべての確率を持っていないので、確率変数。これが、ウィキペディアがランダム変数を条件付けていないため、条件付き確率表記を使用することは曖昧かもしれないと述べている理由です。一方、ベイジアン設定では、θθ XfXθθθ 確率変数であり、分布を持っているので、他の確率変数と同様に作業でき、ベイズの定理を使用して事後確率を計算できます。ベイジアン尤度は、パラメーターが与えられたデータの尤度を示すため、尤度のままです。唯一の違いは、パラメーターが確率変数と見なされることです。

プログラミングを知っていれば、プログラミングのオーバーロード関数の尤度関数を考えることができます。一部のプログラミング言語では、異なるパラメータータイプを使用して呼び出されたときに異なる動作をする関数を使用できます。このように尤度を考える場合、デフォルトではifは引数としてパラメータ値を取り、このパラメータが与えられたデータの尤度を返します。一方、パラメーターがランダム変数であるベイジアン設定でこのような関数を使用すると、基本的に同じ出力が得られますが、ランダム変数を調整しているため、条件付き確率として理解できます。どちらの場合でも、関数は同じように機能します。使用するだけで少し異なります。

// likelihood "as" overloaded function
Default Likelihood(Numeric theta, Data X) {
    return f(X, theta); // returns likelihood, not probability
}

Bayesian Likelihood(RandomVariable theta, Data X) {
    return f(X, theta); // since theta is r.v., the output can be
                        // understood as conditional probability
}

さらに、ベイズの定理を次のように書くベイジアンを見つけることはできません。

P(θ|X)L(θ|X)P(θ)

θ|XθθθL-記法は一般に、尤度設定のために予約されています。名前の尤度は、同様のことを示すために両方のアプローチで慣習により使用されます。モデルとパラメーターを指定すると、そのようなデータを観察する確率がどのように変わるかを示します。


ありがとう、ティム、これは私の理解に非常に役立っています。私はこの新しい知識で質問(「編集」を参照)を再統合しました。今書いたものはすべて真実だと思います。唯一のホールドアウトは、ベイズ規則のリストの最後のポイントです。あなたが見てみることができれば私はそれをたくさん感謝します。再度ありがとう、そして賛成票を持っている!
クレアトロン

1
@Creatron私はあなたの最後の箇条書きを私の答えにコメントする文を追加しました。
ティム

θP(X=x;θ)P(X=x;θ)
クレアトロン16

(2/2)ただし、2番目のケース(2)では、コンテキストがベイジアン設定の場合、この場合、パラメーターはrvであるため、この場合、尤度は実際には条件付き確率分布であり、ただし、P(b | a)はL(a | b)として記述されます。したがって、最初の「デフォルト」の場合、尤度は間違いなく確率分布ではありませんでした(ただし、確率値と等しくなりました)が、2番目の場合、尤度は実際には確率分布であり、その確率分布は条件付きですP(b | a)として書かれた確率。これは正しいです?
クレアトロン

2
ティムに感謝します。@ amoebaの答えを受け入れましたが、あなたの投稿は、この多様で深い概念を理解するのに本当に役立ちました。ありがとうございました!
クレアトロン

7

混乱の原因となる方法で詳細が不正確または省略される可能性の一般的な説明には、いくつかの側面があります。ウィキペディアのエントリはその良い例です。

x

第二に、個々の尤度よりも尤度関数について考えるほうがより有用です。尤度関数は、尤度関数のグラフから明らかなように、モデルパラメーター値の関数です。また、このようなグラフを使用すると、モデルがそれらのパラメーター値に設定されたときにデータを予測する度合いに応じて、パラメーターのさまざまな値を尤度でランク付けできることがわかりやすくなります。私の意見では、尤度関数の調査により、元の質問で与えられたさまざまな式のコジティングよりも、データとパラメーター値の役割がはるかに明確になります。

(モデル内の)パラメーター値の観測データによって提供される相対的なサポートの度合いが未知の比例定数の問題を回避するため、尤度関数内の尤度のペアの比率を使用すると、これらの定数は比率で相殺されます。定数は、別々の尤度関数(つまり、異なる統計モデル)に由来する尤度の比で必ずしも相殺されないことに注意することが重要です。

最後に、尤度はデータだけでなく統計モデルによっても決定されるため、統計モデルの役割について明示することが有用です。異なるモデルを選択すると、異なる尤度関数が得られ、異なる未知の比例定数を得ることができます。

したがって、元の質問に答えるために、尤度はあらゆる種類の確率ではありません。彼らはコルモゴロフの確率の公理に従わず、さまざまなタイプの確率が果たす役割からの推論の統計的サポートにおいて異なる役割を果たします。

  1. フィッシャー(1922)統計の数学的基礎について http://rsta.royalsocietypublishing.org/content/222/594-604/309

1
P(a|b)=P(b|a)P(a)P(b)P(b|a)P(a)

@Creatron 1.いいえ、文は必ずしも間違っているわけではありません。尤度関数は、エビデンスが計算に入力される方法であり、それを確率分布と組み合わせて確率分布を生成します。その文脈では、未知の比例定数は問題ではありません。なぜなら、尤度関数と事前確率分布の積が適切な単位積分(または合計)を持つように任意にスケーリングされるためです。
マイケルルー

2.最尤推定値を見つけるという文脈では、条件付き確率を使用するか尤度を使用するかに違いはありません。これらはパラメーター値の範囲全体に比例するからです。
マイケルルー

1
L(θ|x)=P(x|θ)L(θ|x)P(x|θ)

Micheal Lewに感謝します。あなたの投稿はこの問題の私の理解に大いに役立ちました。
クレアトロン

7

L(θ)θθθ

θL(θ)=,
L(θ)=1θdθΘ
ΘL(θ)dθ=.
L
θP(xθ) and NOT xP(xθ).

2
+1および回答の編集に感謝します。\mid存在することを忘れました。
アメーバは、モニカを復活させる

@amoeba:手伝ってくれてうれしい。
マイケルハーディ

3

「私はこれを次のように読みます。」パラメータXシータ」。(強調のために太字は私のものです。)

P(x|θ)L(θ|x)

θθ=θθ


P(a|b)L(θ|x)=P(X=x;θ)

P(a|b)=P(b|a) P(a)P(b)P(b|a)

L(θ|x):=P(x|θ)θxLLθ

L(θ|x)P(x|θ)

これは今私にとってより理にかなっています。最初の助け、@ Alexに感謝します。
クレアトロン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.