経験的CDFとCDF


20

経験累積分布関数について学んでいます。しかし、私はまだ理解していません

  1. なぜ「経験的」と呼ばれるのですか?

  2. Empirical CDFとCDFに違いはありますか?



ボックスモデルのチケットに関しては、シンプルでわかりやすく、エレガントな説明があります。CDFは、元のボックスの内容を説明します。ECDFは、サンプル(元のボックスから引き出されたチケットのセット、いわゆる「経験的」データ)を空のボックスに入れたときに得られるものです。
whuber

知っておくべきことの1つは、CDFはそうではないかもしれないが、あなたの経験的分布は通常それが構築される方法によって制限されるということです。たとえば、ポアソン変数の観測から経験的CDFを構築する場合、取得されたECDFは観測された最高の周波数に制限され、真のCDFは無制限になります。
アクサカル

回答:


26

ましょランダムな変数です。バツ

  • 累積分布関数は、与えます。FバツPバツバツ
  • 経験的累積分布関数関数は、サンプルの観測に基づいてを与えます。GバツPバツバツ

区別は、どの確率尺度が使用されるかです。経験的CDFでは、経験的サンプルの頻度カウントで定義された確率測定を使用します。

簡単な例(コインフリップ):

LET単コイン投げの結果を表す確率変数である意味ヘッド及び意味テールを。バツバツ=1バツ=0

公正なコインのCDFは、

Fバツ={0にとって バツ<012にとって 0バツ<11にとって 1バツ

2つのヘッドと1つのテールを反転させた場合、経験的CDFは次のようになります

Gバツ={0にとって バツ<023にとって 0バツ<11にとって 1バツ

経験的CDFは、サンプルでは、フリップのがヘッドだったことを反映しています。2/3

別の例(は正規分布のCDFです):F

ましょ平均して正規分布確率変数もと標準偏差。バツ01

CDFは次によって与えられます。

Fバツ=バツ12πeバツ22

3つのIID描画があり、値を取得したとします。経験的CDFは次のようになります バツ1<バツ2<バツ3

Gy={0にとって y<バツ113にとって バツ1y<バツ223にとって バツ2y<バツ31にとって バツ3y

十分なIID描画(および特定の規則性条件が満たされる)により、経験的CDFは母集団の基礎となるCDFに収束します。


12

Empirical CDFとCDFに違いはありますか?

はい、それらは異なります。経験的累積分布関数は適切な累積分布関数ですが、経験的累積分布関数は離散分布から引き出されない場合でも常に離散的であり、分布の累積分布関数は離散的以外の別のものでもかまいません。

サンプルを値の母集団であるかのように扱う場合、それぞれが等しく確率が高い(つまり、各観測値に確率1 / nを置く)場合、その分布の累積分布関数はデータのECDFになります。

なぜ「経験的」と呼ばれるのですか?

サンプルに基づく母集団累積分布関数の推定値です。具体的には、個別のデータ値ごとにサンプルの割合を処理し、母集団の確率であるかのように処理すると、ECDFが取得されます。

経験的は「理論ではなく観察による」のような意味を持ち、それはまさにこの場合の意味です...分布関数を決定するために観察を使用します。


10

経験的CDFは、実際のデータセットから構築されます(以下のプロットでは、標準正規分布から100個のサンプルを使用しました)。CDFは理論上の構造です。無限に多くのサンプルを取得できる場合に表示されるものです。

経験的CDFは通常、特に大規模なサンプルの場合、CDFに非常によく近似します(実際、サンプルサイズが大きくなるにつれて、CDFに収束する速さに関する定理があります)。

経験的CDFとCDF


10

経験的とは、データと観測から構築するものです。たとえば、ある国の人々の身長の分布について知りたいとします。人を測定することから始めて、分布に近似できるヒストグラムを作成します。次に、経験的CDFを計算します。

統計分布(同じパラメーターでまったく同じ出力を提供する決定論的公式)を使用している場合、そのCDFも計算できます。

Nμ=1.75 mσ=0.1 m


CDFとEmperical CDFが、世界のすべての実験サンプリングの限界において同じ母集団を記述する可能性を表す信頼性測定が採用されていますか?これは、たとえば選挙投票に適用されるように思われます。(ただし、出力は関数として厳密に記述できないため...ではありませんが)
-BenPen

3

Dictionary.comによると、「経験的」の定義には以下が含まれます。

経験または実験から導き出されるか、導かれます。

したがって、経験的CDFは、データから取得したCDFです。これは、正規分布などの統計モデルまたは確率モデルから取得される理論上のCDF(「CDF」と呼ばれることが多い)とは対照的です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.