タイトルが言うように、確率密度関数と確率分布(または単に「分布」)という用語は交換可能ですか?そうでない場合、違いは何ですか?
タイトルが言うように、確率密度関数と確率分布(または単に「分布」)という用語は交換可能ですか?そうでない場合、違いは何ですか?
回答:
確率密度関数(pdf)という語句は、特定の確率変数Xに対する関数を意味します(これは、この関数を他の確率変数のpdfから区別するために、この添え字があるためです)。そのすべての実数用及びBように< B、 P { < X ≤ B } = ∫ BのF X(U ) 別の積分は、それは我々が使用しているものとして、シンボル以上に問題ないことをメモとして機能することを目的としている引数 の F X(⋅ )、それがあることではない残念ながらあまりにも多くの場合、上の開始者によって考えられているよう(場合この件名)引数は、確率変数を示す大文字に対応する小文字でなければなりません。我々はまた、主張 ∫ ∞ - ∞ fをX(U )
=======
一部の人々が主張する語句確率分布の非常に限定的な定義があるかもしれませんが、この用語の口語的な使用は、pdfとCDFおよびpmf(ddfまたは離散密度関数とも呼ばれる確率質量関数)を広く含みます。そして、確率変数の確率的振る舞いを説明するものとして含めたいと思うものは何でも。たとえば、フレーズ
平均密度への口語による分布のもう1つの例として 、モデレーターGlen_bが最近投稿した回答からのこの引用を考えてみましょう。
「というモードは、分布は1つのみであることを意味します。」
密度は、ユニークなモードを持っているかもしれませんが、CDFは、(未伸長実数で)ユニークなモードを持つことはできません。しかし、その引用を読んだ誰も、Glen_bが「ディストリビューション」を書いたときにCDFを意味するとは思わないでしょう。
一般的な使用法に関しては、Rで使用されている用語を解析することを検討してください。Distributions{stats}ヘルプページの説明では、次のように述べています。
多くの標準確率分布の密度、累積分布関数、分位数関数、ランダム変量生成は、statsパッケージで利用できます。
組み込み分布のそれぞれについて、(個々のヘルプページに応じて)「密度」(たとえばdnorm
、正規、dbinom
二項)と、「分布関数」(たとえばpnorm
、pbinom
;上の「累積分布関数」と呼ばれます)を提供します上記のように、メインの配布ページ)。
したがって、「確率分布」は分布のファミリー(おそらくそのメンバー)を説明し、「密度」は二項分布のような離散分布に使用でき、「分布関数」という表現は、累積分布関数が意図されているものです。
あるいは、経験豊富な人の間での一般的な使用法は、多くの場合、明確にするためにコンテキストに依存すると主張するかもしれません。
番号。
「確率密度関数」は連続分布のみに使用されます。離散分布はpdfを持つことはできません(pdfで近似することはできます)。「確率分布」は、二項分布などの離散分布によく使用されます。
「確率分布」は離散分布と連続分布の両方に意味がありますが、確率分布は離散分布にのみ直接適用できます。単語が連続分布で使用される場合、正規分布などの基礎となる数学的構造を指します。これは、ほとんどの目的で、適用する前に関数(通常は確率密度関数または累積密度関数)でインスタンス化する必要があります。