確率密度関数と確率分布(または単に「分布」)という用語は交換可能ですか?


8

タイトルが言うように、確率密度関数と確率分布(または単に「分布」)という用語は交換可能ですか?そうでない場合、違いは何ですか?


2
2つのうち、私は実際、これは多くの点でより適切な質問だと思います。しかし、後者の2つはおそらく閉じられるべきものです。
Silverfish、2015

@Silverfishこの質問は他の質問よりも優れているだけでなく、私の意見では別の質問をしています。確かに、他の質問への(唯一で受け入れられた)回答は、おそらくその最後の文を除いて、この質問にまったく回答しません。私はそれを再開するために投票します。たぶん、これに参加できます。私は不純な動機があることを告白します。ほとんどの人が重複して見られることはほとんどないため、質問はクローズされました。ここで答えを書くのに時間を無駄にしたくありません。その上、私の論争の答えを否定する喜びを人々から奪うことは残念です。
Dilip Sarwate、2015

@Dilipスレッドが本当に重複している場合は、それらをマージして、貢献が元のスレッドの一部になるようにします。ただし、この場合、質問がこのスレッドを再開するのに十分なほど異なるというあなたの主張には同意します。
whuber

@Dilipこれが閉じられたままであった場合、関連しているが同一ではない回答の可視性を高める1つのアプローチは、重複として閉じられる質問のコメントを介してここにリンクを戻すことです。
Glen_b-2015

誰かが以前提案されたdupへのリンクをここに投稿できますか?
kjetil b halvorsen 2018

回答:


5

確率密度関数(pdf)という語句は、特定の確率変数Xに対する関数を意味します(これは、この関数を他の確率変数のpdfから区別するために、この添え字があるためです)。そのすべての実数用及びBように< BP { < X B } = BのF XU fバツバツaba<b 別の積分は、それは我々が使用しているものとして、シンボル以上に問題ないことをメモとして機能することを目的としている引数 F X、それがあることではない残念ながらあまりにも多くの場合、上の開始者によって考えられているよう(場合この件名)引数は、確率変数を示す大文字に対応する小文字でなければなりません。我々はまた、主張 - fをXU

P{a<バツb}=abfバツあなたdあなた=abfバツvdv=abfバツtdt
fバツ 場合、P { X = α } > 0いくつかの実数のための α、その後、 Xは、その確率の計算にディラックデルタを組み込む人を除いてPDFを有していません。
fバツあなたdあなた=1。
P{バツ=α}>0αバツ

Fバツバツ

Fバツα=P{バツα}<α<
Fバツα=αfバツあなたdあなた

=======

一部の人々が主張する語句確率分布の非常に限定的な定義があるかもしれませんが、この用語の口語的な使用は、pdfとCDFおよびpmf(ddfまたは離散密度関数とも呼ばれる確率質量関数)を広く含みます。そして、確率変数の確率的振る舞いを説明するものとして含めたいと思うものは何でも。たとえば、フレーズ

バツab

バツab バツba1ab0バツabバツab

平均密度への口語による分布のもう1つの例として 、モデレーターGlen_bが最近投稿した回答からのこの引用を考えてみましょう。

「というモードは、分布は1つのみであることを意味します。」

密度は、ユニークなモードを持っているかもしれませんが、CDFは、(未伸長実数で)ユニークなモードを持つことはできません。しかし、その引用を読んだ誰も、Glen_bが「ディストリビューション」を書いたときにCDFを意味するとは思わないでしょう。


1
L1

1
@whuber質問と賛成投票を再開していただきありがとうございます。通常のランダム変数を削除して、「分布」が常にCDFを意味するわけではなく、密度やpdfの代わりになる理由をより適切に説明したものに置き換えました。
Dilip Sarwate、2015

1
編集では、口語的な用法の解釈に代わって、非常に良い主張をします。
whuber

2

一般的な使用法に関しては、Rで使用されている用語を解析することを検討してください。Distributions{stats}ヘルプページの説明では、次のように述べています。

多くの標準確率分布の密度、累積分布関数、分位数関数、ランダム変量生成は、statsパッケージで利用できます。

組み込み分布のそれぞれについて、(個々のヘルプページに応じて)「密度」(たとえばdnorm、正規、dbinom二項)と、「分布関数」(たとえばpnormpbinom;上の「累積分布関数」と呼ばれます)を提供します上記のように、メインの配布ページ)。

したがって、「確率分布」は分布のファミリー(おそらくそのメンバー)を説明し、「密度」は二項分布のような離散分布に使用でき、「分布関数」という表現は、累積分布関数が意図されているものです。

あるいは、経験豊富な人の間での一般的な使用法は、多くの場合、明確にするためにコンテキストに依存すると主張するかもしれません。


0

番号。

  1. 「確率密度関数」は連続分布のみに使用されます。離散分布はpdfを持つことはできません(pdfで近似することはできます)。「確率分布」は、二項分布などの離散分布によく使用されます。

  2. 「確率分布」は離散分布と連続分布の両方に意味がありますが、確率分布は離散分布にのみ直接適用できます。単語が連続分布で使用される場合、正規分布などの基礎となる数学的構造を指します。これは、ほとんどの目的で、適用する前に関数(通常は確率密度関数または累積密度関数)でインスタンス化する必要があります。


1
「「確率分布」は通常、離散分布に使用され、明確に定義されているだけです」たとえば、正規分布は確率分布ではないということですか。
Juho Kokkala 2018

@コッカラ:もしそうなら、私は単に「確率分布は離散分布にのみ使用されるべきだ」と言っただろう。それらの余分な単語は、人々が例えば正規分布を確率分布と呼ぶ場合を考慮に入れるためのものでした。しかし、あなたは良い点を挙げます:連続領域では、「確率分布」がまだ使用されていますが、確率分布を適用するために、pdfやcdfなど、より具体的なインスタンス化を使用する必要があります。できれば私は私の答えを修正します。
Phil Goetz 2018

1
バツバツPrバツバツ

1
これでファッションが変わります。式確率質量関数は、離散ケースを完全に区別するために導入されましたが、逆に、密度はカウントメジャーの観点から定義された密度である可能性があると多くのライターが説明しています。それはすべて、根本的な対策の問題です。だから、いいえ。有能なライターは密度関数を記述でき、連続変数への適用性だけでなく、幅広い定義を念頭に置いています。ピーター・ウィットルの中間確率テキストがその好例です。
Nick Cox
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.