通常、離散変数にわたる確率分布は、確率質量関数(PMF)を使用して記述されます。
連続確率変数を使用する場合、確率質量関数ではなく確率密度関数(PDF)を使用して確率分布を記述します。
- ディープラーニンググッドフェロー、Bengio、およびCourvilleによって
しかし、Wolfram MathworldはPDFを使用して、離散変数の確率分布を記述しています。
これは間違いですか?またはそれは大した問題ではありませんか?
通常、離散変数にわたる確率分布は、確率質量関数(PMF)を使用して記述されます。
連続確率変数を使用する場合、確率質量関数ではなく確率密度関数(PDF)を使用して確率分布を記述します。
- ディープラーニンググッドフェロー、Bengio、およびCourvilleによって
しかし、Wolfram MathworldはPDFを使用して、離散変数の確率分布を記述しています。
これは間違いですか?またはそれは大した問題ではありませんか?
回答:
それは間違いではありません。測度理論を介した確率の形式的取り扱いでは、確率密度関数は「支配測度」(「参照測度」とも呼ばれます)に関して取られた関心のある確率測度の導関数です。整数の離散分布の場合、確率質量関数は、測定値を基準とした密度関数です。確率質量関数は特定の種類の確率密度関数であるため、密度関数と呼ばれるこのような参照を見つけることがありますが、このように参照するのは間違っていません。
確率と統計に関する通常の談話では、しばしばこの用語を避け、「質量関数」(離散確率変数の場合)と「密度関数」(連続確率変数の場合)を区別して、離散分布と連続分布を区別します。確率の全体的な側面を述べる他の状況では、区別を無視し、両方を「密度関数」と呼ぶ方がよい場合がよくあります。
treatment
平均表記、視点、条約または何か他の「確率の正式な治療で」?
メジャー理論の観点からのより理論的な答えに加えて、統計プログラミングでpmfsとpdfを区別しないことも便利です。たとえば、Rには豊富な組み込みディストリビューションがあります。各ディストリビューションには、4つの機能があります。たとえば、正規分布の場合(ヘルプファイルから):
dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.
Rユーザーは急速にd,p,q,r
プレフィックスを使用するようになります。ドロップd
や使用m
などの操作を2項分布などに行わなければならない場合は、面倒です。代わりに、すべてがRユーザーが期待するとおりです。
dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
scipy.stats
区別されるのは、pdf
メソッドを持つオブジェクトとメソッドを持つオブジェクトがありますpmf
。それは本当に私を悩ます!