密度プロットの高さの解釈方法


12

密度プロットの高さの解釈方法:

ここに画像の説明を入力してください

たとえば、上のプロットでは、ピークはx = 18で約0.07にあります。値の約7%が約18であると推測できますか?それよりも具体的にできますか?また、高さ0.02のx = 30に2番目のピークがあります。これは、値の約2%が約30であることを意味しますか?

編集:1を超える確率分布値は問題ないのですか?ここではまったく問題ではない確率値> 1について説明します。また、単純なベイズの分類法に関連して、ここでもポイントではないことを説明します。私は、このような密度曲線から描くことができる数値的推論を、簡単な言葉で言いたいです。曲線下面積の役割について説明しますが、私の質問は、曲線上に存在する特定のxとyの組み合わせに関して具体的にどのような推論を引き出すことができるかです。たとえば、このグラフでx = 30とy = 0.02をどのように関連付けることができますか。ここで30と0.02の関係についてどのような記述を書くことができますか。密度は1つの単位値であるため、値の2%が29.5と30.5の間で発生していると言えますか?その場合、次のプロットのように、値が0から1までしか変化しない場合、どのように解釈するのでしょうか。

ここに画像の説明を入力してください

値の100%が0と1の間にある場合、なぜ0と1の外側に曲線があるのですか?

ここで、x = 0.1からx = 0.2に平坦な部分があり、yは0.8です。長方形を形成します。x = 0.1とx = 0.2の間でどのような値の割合が発生するかを知るにはどうすればよいですか

(PS:この質問がおもしろい/重要だと思ったら、賛成してください;)



4
重複として言及された最初のスレッドは、タイトルの正確な表現にもかかわらず関連性があります。これは、連続変数に対して計算された確率密度は確率ではないという重要なポイントです。(より微妙なバージョンでは密度を厳密に定義し、密度をカウントメジャーで定義する可能性を含めます。)
ニックコックス

私は@NickCoxに同意しますが、追加の編集では、Timの密接に関連する質問の非常に良いリストで、エリア(3番目の質問のような)と高さ(2番目の質問のような)に重点が置かれます。
シルバーフィッシュ

3
また、これらの質問で提起されていない別の問題もあります。それが、これがこれらの質問の個々の全体的な複製だと思わない理由です。理論密度プロットとは対照的に経験的に、外部に「密度」があるのはなぜですか分布のサポート(または観測値)?それには、帯域幅とカーネル密度プロットの構築と解釈に関する追加の議論が必要です。おそらく、この質問は、既存の質問と重複しない問題の編集と再焦点化の恩恵を受けるでしょう。
シルバーフィッシュ

回答:


6

ここでの文言に注意する必要があります。xが連続変数であると仮定すると、個々の値の確率は正確にゼロです。あなたがやったように、ある点の周りにある値の確率について話すのは問題ありませんが、もう少し正確にしたいかもしれません。確率とともに間隔を指定した2番目のステートメントは、私が探しているものです。

本質的に、xに関する密度関数の積分は、確率自体について教えてくれます(それが密度と呼ばれる理由です)。明らかに、統合する間隔は任意に小さくすることができるため、任意の程度までポイントに近づけることができます。とは言っても、密度関数がその間隔にわたって非常にゆっくりと変化している場合、台形規則などの数値手法によって積分を近似することができます。

要約すると、密度関数の高さはまさにその高さです。確率について結論付けたいものには、何らかの形の統合を含める必要があります。


この種のプロットでは、曲線の下の面積は常に1.0になりますか?
ecologist1234

1
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.