カーネル密度チャートを説明する


8

線形モデルでシミュレーションを実行しています。1000の結果が得られ、結果は密度チャートに入れられます。私はx軸が従属変数であり、y軸がカーネル密度を表すことを理解しています。Y軸は0から0.15のような10進数です。これを他のユーザーに説明するにはどうすればよいですか?シミュレーションされた値がx1とx2の間に入る確率は15%ですか?

これは私のシミュレーション出力です:

summary(s)

Model:  ls 
Number of simulations:  1000 

Values of X
  (Intercept)  Volume
1           1 1699992
attr(,"assign")
[1] 0 1

Expected Values: E(Y|X) 
    mean    sd    50% 2.5%  97.5%
1 12.305 2.638 12.231 7.03 17.512

ここに画像の説明を入力してください


他の密度の高さをどのように説明しますか?(それがあなたが知らない部分である場合、あなたは間違った質問をしているようです-より一般的なものが必要です;密度が何であるかを説明する方法を知っている場合、説明は同じです)
Glen_b -Reinstate Monica

回答:


14

カーネル密度推定は、平滑化されたヒストグラムと考えることができます。ヒストグラムは、それらが本質的に(ビンを介して)離散的であり、したがって離散変数に関するデータを表示するのにより適切であり、ビンのサイズに非常に敏感である可能性があるという事実によって制限されます。

カーネル密度推定で実際に行っているのは、確率密度関数を推定することです。これにより、解釈が簡単になります。したがって、曲線の下の領域は1であり、x1とx2の間にある値の確率は、これらの2点間の曲線の下の領域です。

Y値の数によって曲線の「解像度」が決まるため、隣接する2つのY点間の直線を想定すると、これらの2点間の曲線の下の領域の近似を計算できます。

バツPバツa<バツ<バツb

Pバツa<バツ<バツb=ya++yb

y


さて、上のグラフを見て、0.10は何を意味するのでしょうか?x軸とは何か知っています。これが良い見積もりであることをどうやって確認できますか?
user1471980

上のグラフを見ると、y軸のc(0.00、0.10)であり、x軸が5から20の間で変化する確率を計算する必要があります(20-5)*(0.10 + 0.00)/2=0.75。シミュレーションの値が5〜20になる確率は75%です。これでよろしいですか?
user1471980

私はこれを得ていると思います。しかし、私は確認する必要があります。y-axix c(0、0.05、0.10、0.15)、xaxis c(5,10,15,20)、累積を計算する:(20-5)*(0.0 + 0.05 + 0.1 + 0.15)/4=1.125 (この値は1よりも大きいですか?)
user1471980

@ user1471980回答を更新しました。混乱を避けるためにコメントを削除しています。
ビットワイズ

1

上記の投稿にコメントする評判がないので...

Pバツa<バツ<バツb=ya++ybyayb

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.