条件付き密度プロットの解釈


10

条件付き密度プロットを正しく解釈する方法を教えてください。でRで作成したものを2つ挿入しましたcdplot

たとえば、変数1が150の場合、結果が1になる確率は約80%ですか?

条件付き密度プロット

濃い灰色の領域は、条件付き確率がResult1に等しい確率です。

条件付き密度プロット

cdplotドキュメントから:

cdplotは、yの周辺分布によって重み付けされたyのレベルを指定して、xの条件付き密度を計算します。密度は、yのレベルにわたって累積的に導出されます。

この累積は、これらのプロットの解釈にどのように影響しますか?

回答:


7

たとえば、変数1が150の場合、結果が1になる確率は約80%ですか?

=0=150=1=150

濃い灰色の領域は、結果が1に等しいという条件付き確率です。

=0=1

Resultファクターに3つ以上のレベルがある場合、何が表示されているかがより明確になります。私たちは密度関数を見るのに慣れているだけなので、このプレゼンテーションは最初は混乱するかもしれません。

この累積は、これらのプロットの解釈にどのように影響しますか?

のソースを見ると、cdplot()ここで起こっていることは、結果の平滑化された比率が説明変数の密度によって重み付けされていることです。したがって、従属変数の分布は、説明変数の密度の高い領域でより適切に表現されます。

これを解釈する1つの方法は、ポイントが少ない説明変数の領域がある場合、条件付き分布が適切に決定されないことです。ポイントが多い説明変数の領域がある場合、条件付き分布がより適切に決定されます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.