1を超える確率分布値でも問題ありませんか?


149

上の単純ベイズ分類器についてのWikipediaのページ、この行があります:

p(height|male)=1.5789(1を超える確率分布は問題あり。釣鐘曲線の下の面積は1です。)

値でも問題ありませんか?すべての確率値は範囲で表現されると思いました。さらに、そのような値を持つことが可能であるとすると、ページに示されている例ではその値はどのように取得されますか?>10p1


2
確率密度関数の高さは、任意の間隔で積分される限り、任意の正数になる可能性があると思ったとき、積分は1以下です。Wikipediaはそのエントリを修正する必要があります。
マイケルチャーニック

16
これは将来の読者を助けるかもしれないので、私はこの質問の一般的な一部の幾何学的な翻訳を提供します:「どのようにその面積形状は超えていないことができますおそらく以上延長任意の方向に?」具体的には、形状は、PDFのグラフによって上に囲まれた上半平面の一部であり、問​​題の方向は垂直です。幾何学的な設定(確率解釈の短縮)では、以下の底辺と高さ長方形などの例を考えるのは簡単です。111/22
whuberの

ウィキペディアの記事では現在p、確率密度に小文字を使用し、確率に大文字Pを使用しています
-Aprillion

次の人のためにここに置いておきます:en.wikipedia.org/wiki/Dirac_delta_function
ジョシュア

累積分布関数(PDFの積分)は1を超えることはできないことに注意してください。CDFは、多くの場合、より直感的に使用できます。
naught101

回答:


167

このWikiページは、この数字を確率として参照することで言語を乱用しています。そうではないのは正しいことです。実際には1フィートあたり確率です。具体的には、1.5789(6フィートの高さ)の値は、5.99から6.01フィートの間の高さの確率が次の単位なしの値に近いことを意味します。

1.5789[1/foot]×(6.015.99)[feet]=0.0316

ご存じのように、この 1を超えてはなりません。(高さの小さな範囲(この例では0.02)は確率装置の重要な部分です。これは高さの「微分」です。これをと略し。)何かの単位あたりの確率は単位体積あたりの質量など、他の密度と同様に密度と呼ばれます。d(height)

善意の確率密度は、無限の値であっても、任意の大きな値を持つことができます。

ガンマ分布

この例は、ガンマ分布(形状パラメーターおよびスケール)の確率密度関数を示しています。ほとんどの密度は未満であるため、すべての確率分布に必要な合計面積をにするには、曲線をより高く上昇させる必要があります。3/21/5111

ベータ配布

この密度(パラメーターベータ分布の場合)はおよびで無限になります。総面積はまだ有限です(そして等しい)!1/2,1/10011


この例では、男性の身長が平均5.855フィート、分散3.50e-2平方フィートの正規分布を持っていると推定することで、1.5789 /フィートの値が得られます。(これは前の表にあります。)その分散の平方根は、標準偏差0.18717フィートです。平均からのSDの数として6フィートを再表現します。

z=(65.855)/0.18717=0.7747

標準偏差による除算は、関係を生成します

dz=d(height)/0.18717

定義により、正規確率密度は

12πexp(z2/2)dz=0.29544 d(height)/0.18717=1.5789 d(height).

(実際、私はごまかしました:ExcelにNORMDIST(6、5.855、0.18717、FALSE)を計算するように単純に依頼しました。しかし、確かに式に対してそれを本当に確認しました。)本質的な微分チェシャ猫の笑顔のように、式からは数値のみが残ります。読者は、確率を得るために、数値に高さの小さな差を掛ける必要があることを理解する必要があります。d(height)1.5789


そのwikiページで与えられている例では、事後の計算に実際の確率の代わりに確率密度を使用していることに注意してください。これを拡張し、正規性を仮定したくないが、代わりに密度を推定できる経験的データ、たとえばカーネル密度推定がある場合、これからx軸上の特定の値で読み取り値を使用することが有効です単位ごとに等しいと仮定して、単純ベイズ分類器で事後を計算するための入力としてのkde?
-babelproofreader

1
@babelproofreader後継者は、訓練データによる事前のベイジアン更新であると思います。kdeを同様に解釈する方法は不明ですが、この分野の専門家ではありません。あなたの質問は非常に興味深いので、個別に投稿することを検討してください。
whuber

良い差とは何ですか?代わりに1の差分を選択した場合はどうなりますか?確率は1より大きくなりますか?ここで混乱してすみません。説明できる?
fiacobelli 14年

3
@tree三角形の面積は、底辺の長さと高さの積の半分です。
whuberの

1
@ user929304あなたはあなたにアピールする理論的な教科書を参照できます。これは確率と統計の基礎の一部です。確率密度のこの特定の概念は、Freedman、Pisani、Purvesなどの入門書で詳しく説明されています。
whuber

43

これは、変数が離散的である確率質量関数と変数が連続的である確率密度関数の違いを理解していないことによるよくある間違いです。確率分布とはをご覧ください:

連続確率関数は、連続間隔での無限数のポイントに対して定義され、単一のポイントでの確率は常にゼロです。確率は、単一ポイントではなく、間隔にわたって測定されます。つまり、2つの異なるポイント間の曲線の下の領域が、その間隔の確率を定義します。これは、確率関数の高さが実際には1より大きくなる可能性があることを意味します。積分が1に等しくなければならない特性は、すべての確率の合計が1に等しくなければならない離散分布の特性と同等です。


14
NISTは通常は信頼できますが、ここでは技術的に正しくありません(そして起動するのは文法的ではありません)。もちろん、彼らは無限の基数について気を散らすものを避けているだけですが、ここでの推論は誤解を招くものです。引用の最初の文を省略するだけでよいでしょう。
whuberの

23

区間にわたる連続的な均一分布は、この質問の簡単な例を提供すると思います。連続的な均一分布では、各点の密度は各点で同じです(均一分布)。さらに、長方形の下の領域は1でなければならないので(通常の曲線の下の領域が1でなければならないのと同じように、ベースおよび領域長方形は高さ。[a,b]1/(ba)ba11/(ba)

したがって、間隔の均一密度の値はであり、間隔では、...[0,0.5]1/(0.50)=2[0,0.1]10


4

ウィキペディアの記事がこのスレッドの最初の投稿に続いて編集されたかどうかはわかりませんが、「ここで1より大きい値でも構いません。高さは確率ではなく確率密度です。少なくともこの直接的なコンテキストでは、Pは確率に使用され、pは確率密度に使用されます。はい、記事は確率を意味するためにいくつかの場所でpを使用し、確率密度として他の場所でpを使用するため、非常にずさんです。

元の質問「1を超える確率分布値で問題ないか」に戻ります。いいえ、しかし、私はそれを完了しました(以下の最後の段落を参照)。

確率> 1を解釈する方法は次のとおりです。まず、スポーツでよく耳にし、時にはhttps://www.youtube.com/watch?v=br_vSdAOHQQで仕事をしているので、人々は150%の努力をすることができます。何かが起こると確信している場合、それは1の確率です。1.5の確率は、イベントが発生する150%の確信があると解釈できます-150%の努力をするようなものです。

また、確率が1を超えることができる場合は、確率を0未満にすることができます。負の確率は次のように解釈できます。0.001の確率は、イベントが発生する可能性がほとんどないことを意味します。確率= 0は「ノーウェイ」を意味します。-1.2などの負の確率は、「冗談でしょう」に対応します。

私が30年前に学校を出たばかりの不機嫌だったとき、私は航空の音の壁を破る、つまり、確率で統一の壁を破るよりも驚くべき出来事を目撃しました。博士号を持つアナリスト 物理学で2年間フルタイム(おそらく150%を与える)でオブジェクトXを検出する確率を計算するためのモデルを開発し、その終わりに彼のモデルと分析は、米国に密接に関係する複数の科学者とエンジニアによるピアレビューを正常に完了しました政府。オブジェクトXが何であるかは説明しませんが、オブジェクトX、およびオブジェクトXを検出する確率は、米国政府にとって非常に興味深いものです。モデルには、 = Prob(イベントyが発生する)の式が含まれていました。 PyPyそして、他のいくつかの用語がすべて組み合わされて最終式がProbになりました(オブジェクトXが検出されました)。確かに、Prob(オブジェクトXが検出された)の計算値は[0,1]の範囲内であり、コルモゴロフの伝統の確率では「伝統的」でした。 元の形式のは常に[0,1]にあり、標準のFortranまたは任意の科学計算機で利用可能な「園芸品種」の超越関数が含まれていました。ただし、アナリストと神にしか知られていない理由のために(おそらく、彼は物理学のクラスや本でそれを見たことがあるが、それが機能する少数のケースではなく、それが機能する多くのケースが示されたことを知らなかったため)この男の名前と科学的/数学的な判断は、たまたまディラックのものではありませんでした)、PyPy(そして、残りの項を無視します)、これ以降と呼ばれ。Probの最終式に挿入されたのは、この2項テイラー展開です(オブジェクトXが検出されます)。私が彼に指摘するまで、彼がていたのは、がすべてのパラメーターの基本ケース値を使用して約1.2に等しいことた。確かに、は可能PyPyPyPy約1.8まで進みます。そして、それが統一の障壁が確率で破られた方法です。しかし、暗闇の会議室で電池式のクレジットカードサイズのカシオ関数電卓で簡単な計算を行っただけで、彼はこの先駆的な偉業を成し遂げたことに気付きませんでした(とは言えませんでした)ソーラー電卓)。それはチャック・イェーガーが飛行機で日曜日のスピンに出かけ、数ヶ月後に彼が音の壁を破ったことを知らされるようなものです。


クールな話。引用など、これに関する詳細情報はありますか?
ジェイシラーラート

1
@ Jay Schyler Raadtこれは、stats.stackexchange.com / questions / 4220 /…で文書化されています。
マークL.ストーン

0

確率変数が連続で、その確率密度関数が場合、は確率ですが、は確率ではなく、1より大きくなる可能性があります。報告されたは確率ではありませんが、は確率です。Xf(x)f(x)dxf(x)f(height|male)f(height|male)dheight

つまり、連続ランダム変数場合、、および。条件付き確率についても同じことが言えます。XP(X[x,x+dx))=f(x)dxP(X[a,b])=abf(x)dxP(X=x)=P(X[x,x])=0


-1

確率密度プロットの特定のパラメーター値でのポイント値は、尤度ですよね?その場合、P(height | male)をL(height | male)に変更するだけでステートメントを修正できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.