CDFはPDFよりも基本的ですか?


43

私の統計学教授は基本的に、次の3つのうちの1つが与えられた場合、他の2つを見つけることができると言いました。

  • 累積分布関数
  • モーメント生成機能
  • 確率密度関数

しかし、私の計量経済学の教授は、CDFはPDFよりも基本的であると言いました。なぜなら、CDFを持つことはできてもPDFが定義されていない例があるからです。

CDFはPDFよりも基本的ですか?PDFまたはMGFがCDFから派生できるかどうかを知るにはどうすればよいですか?


23
これはある種の根本的なコンテストですか?有名人の審査員団はありますか?これら3つの概念はすべて、空間尺度を定義するために使用できますRd。PDFは、CDFの導関数として定義され、MGFのように定義されているようしかし、所与のCDF、MGFとPDFのために、存在しないかもしれないRexptバツdFバツ、及び存在しないこの積分必要。ただし、これは、これらの概念のいずれかが基本的でないことを意味するものではありません。Fundamentalは、数学的な定義がない素晴らしい形容詞です。これは重要な同義語です。
mpiktas

6
@mpiktas:R n(のサブセット)のすべての確率分布にはCDFがあり、分布を一意に定義します。ただし、すべての確率分布にPDFまたはMGFがあるわけではありません(ただし、すべてに特徴的な関数があります)。Rn
イルマリカロネン16年

3
@mpiktasあなたはでそれを行う可能性があります上のR。そして、Pは、- X ]が。。定義されていない教授は表現「もっと根本的な」を使用した理由にもかかわらず、それは私には明確な結晶である形容詞はありません明確に定義された数学的な意味を持っているかもしれませんが、だから何、私は(いくつかを話します?あまりにも)英語我々が基本となるが、CDFを持って知っているすべてのPDFここで、「根本的な」「基本」との素敵な関連を持っている、反対は本当ではありません。。。。A={R}RPバツ]
drhab

2
@drhab、当然、私はラドン・ニコディムの派生物について話していました:)私は教授が何を念頭に置いていたかを完全に理解していますが、私の意見では、そのような表現を学生と一緒に使用するのは危険です。数学的概念は、基本性に従ってランク付けしようとしますが、これは根本的に間違っています。意図したパン。
mpiktas

4
@mpiktas:確かに、「基本」の正確な定義はありません。しかし、「厳密に定義された」と「完全に無意味」との間には大きな中間点があります。もちろん、数学自体では、すべてが最終的に完全に厳密でなければならないので、そうでないものを平手打ちすることに非常に慣れています。しかし、数学について話したり考えたりするとき、他の人と同じように、「基本的」、「一般的」などの主観的でありながら意味のある概念もあります。そしてそれは大丈夫です。
PLL

回答:


69

(のサブセット)のすべての確率分布には累積分布関数があり、分布を一意に定義します。したがって、この意味で、CDFは実際に分布自体と同じくらい基本的です。Rn

確率密度関数は、しかし、唯一の必要性が存在する(絶対的に)連続確率分布。PDFを欠いた分布の最も単純な例は、整数値のみをとる確率変数の分布など、離散確率分布です。

もちろん、そのような離散確率分布は、代わりに確率質量関数によって特徴付けることができますが、連続分布と離散分布の混合など、PDF PMF 持たない分布もあります。

連続、離散、混合確率分布の図
(図は、関連する質問に対するGlen_bの回答から恥知らずに盗まれました。)

でもあり、特異確率分布のような、カントール分布によっても、説明することができない、組み合わせ PDFとPMFのは。ただし、このようなディストリビューションにはまだ明確に定義されたCDFがあります。たとえば、以下はCantorディストリビューションのCDFであり、「悪魔の階段」とも呼ばれます。

CantorディストリビューションCDF
画像からのウィキメディア・コモンズユーザーによるテオンAmirki下で使用、CC-BY-SA 3.0ライセンス。)

Cantor関数として知られるCDF は連続的ですが、完全に連続的ではありません。実際、ゼロのルベーグ測度のCantorセットを除き、どこでも一定ですが、無限に多くのポイントが含まれています。したがって、Cantor分布の全体の確率質量は、実数線のこの非常に小さいサブセットに集中しますが、セット内のすべてのポイントは、個別にゼロの確率を持ちます。


モーメント生成関数を持たない確率分布もあります。おそらく最もよく知られた例はないコーシー分布脂肪テール分布(平均または分散従って、特に、全く明確に定義された!)ため1以上のない明確に定義されたモーメントを有しています。

ただし、すべての確率分布には(おそらく複素値の)特性関数)があり、その定義はMGFの定義と虚数単位との乗算のみが異なります。したがって、特性関数は、CDFと同様に基本的であると見なすことができます。Rn


すべてのディストリビューションにCDFがあるが、すべてにPDFがあるわけではないと言いますが、実際にはPDFを持ち、閉じた形式のCDFを持たないディストリビューション、たとえば多変量正規分布があります。
ティム

13
@Tim:それは事実ですが、「閉じた形式」修飾子のみです。閉じた形式で記述できない場合でも、CDFは存在します。とにかく、「閉じた形式の表現」の定義はあいまいなことで有名です。いくつかの厳密な定義により、単変量正規分布でさえも閉形式のCDFを持ちませんが、エラー関数を閉形式とみなす場合は閉じます。
イルマリカロネン16年

11
@Timそれは反例ではありません。それはあなたにとって重要/基本的であるとしてあなたが選んだ任意のプロパティです。私にとって、「存在する」プロパティは「閉じたフォームを持っている」よりも重要です。さらに、「常に存在する」対「関数のように閉じた形を持たないこともあります」。
アークくん

3
[01]R

1
@ Ark-kun私はここで悪魔を演じています。なぜなら、PDFはCDFよりも「直接利用可能」なものである場合があるからです。私はこの回答(+1)が好きですが、私見では、これも言及できるものです。
ティム

16

あなたの計量経済学の教授は次のような考えをしていたと思います。

F[01]

Fバツ=12バツ ために バツ<12
Fバツ=12バツ+12 ために バツ12

[01]

P{12}=12

f

f

PDFの定義により、

0バツftdt=FバツF0=14バツ

0<バツ<12

fバツ=14 ために バツ<12

同様に、1から始まり、ゼロに向かって進み、終わる積分バツ>12

fバツ=14 ために バツ>12

したがってを決定しました。ff12f12

P{12}=12

必要になるでしょう

12ϵ12+ϵftdt>12

を含むすべての間隔に対して12

12ϵ12+ϵftdt=12ϵ12+ϵ14dt=12ϵ

f

PDFの精神を回復することはできますが、より洗練された数学的オブジェクト(メジャーまたは分布)を使用する必要があります。


3
12δバツ12δバツバツ=0
+δバツdバツ=1

2
L1

@IwillnotexistIdonotexist whuberが言ったことは、最後の行で私がほのめかしていたことです。「配布」という言葉を使いました。
マシュードゥルーリー

4
1/21/2

4

Ilmariは、理論的な観点から良い答えを提供します。ただし、密度(pdf)と分布関数(pdf)が実際の計算にどのような目的を果たすのかを尋ねることもできます。これにより、一方の状況が他方の状況より直接的に有用である状況を明確にできます。

Rバツ]

ただし、確率は密度の観点から定義されるため、密度は統計にとって不可欠です。したがって、最尤推定値を計算する場合は、密度が直接必要です。

経験的分布と理論的分布の比較に目を向けると、どちらも有用ですが、分布関数に基づくpp-およびqq-plotsなどの方法がしばしば好まれます。

Rdd2

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.