このグラフの線の周りのぼかしはどういう意味ですか?


8

私は次のコマンドを使用してggplot2をいじって、データに行を合わせました。

ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + 
stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + 
stat_sum_single(median) + 
stat_sum_single(mean, colour="blue") + 
geom_smooth(level = 0.95, aes(group=1), method="lm")

赤い点は中央値、青は平均値、垂直の赤い線はエラーバーを示します。最後のステップとして、geom_smooth線形平滑化を使用して線をフィットするために使用しましたmethod="lm"。ラインに沿って、ラインの周りにも鈍い色合いが生成されました。ドキュメントから削除する方法を見つけましたが、オフにするために使用したオプションは次のとおりです。

se: display confidence interval around smooth? 

誰かが私が線の周りの陰から理解すべきことを教えてもらえますか?具体的には、解釈の仕方を理解しようとしています。それはおそらくその行に適したものであるに違いありませんが、追加の情報は私にとって非常に役立つでしょう。助言がありますか?

ここに画像の説明を入力してください

回答:


6

あなたの実際の姿ではほとんど意味がないと思います。あなたはストリッププロット/チャートの形を描きました。しかし、データや再現可能な例がないので、これらの線/領域が一般的に示すものについてのみ説明します。

一般に、線は関係を表す近似線形モデルです

val^=β0+β1Num
影付きの帯は、近似値(直線)の点ごとの95%信頼区間です。この信頼区間には、0.95の確率の真の母集団回帰直線が含まれています。または、言い換えると、真の回帰直線が影付きの領域内にあるという95%の信頼があります。これは、応答と予測変数の間の真の関係の推定に内在する不確実性を示しています。

お返事と時間をありがとうございました。それが私のチャートでほとんど意味がない理由についての最初のコメントの理解に少し時間を費やします。棒グラフを平均で描く代わりに、ストリップチャートを描いて、使用されたポイントの数も確認しました。間違えた場合は訂正してください。私の最後の質問は、この95%信頼区間とエラーバーによって示される95%信頼区間の間に関係があるかどうかです。具体的には、フィットした線が誤差範囲の上または下にあるとはどういう意味ですか?それとも完全に独立していて、別々に解釈する必要がありますか?
Legend

x変量がカテゴリカルである場合、それを1自由度の線形項として扱うことは意味をなさない場合があります。これは、当てはめられた線の計算でどのように扱われたかです。また、データはモデルの残差に対して一定の分散の仮定を示していないようです。ストリップチャートは問題ではなく、これらのデータの回帰が理にかなっているかどうかです。当てはめられた線は、グループ平均を介して、最もよく当てはまる線に近くなります(または誰かが私を修正できる場合もあります)。
Gavin Simpson、

あなたの洞察をありがとうございました。残差の定数分散の仮定について詳しく説明します。
レジェンド

2
うーん。あなたの説明が正しいかどうかは完全にはわかりません-デフォルトでは、95%のごとの信頼区間を描画します。これは、真の回帰直線が網掛けされた領域内にある可能性が95%あると言っていることとはまったく同じではないと思います。
ハドリー2011

@hadleyは頭を平手打ちしますはい、それは同時に信頼区間になります。更新されます。
Gavin Simpson、
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.