私は箱ひげ図の多次元(ここでは2変量)バージョンを紹介する論文を見つけました。そのバグプロットは正確には何ですか?頂点に基づいてネストされた一連のポリゴンを確認できます。これらのポリゴンの1つはバグプロットとして宣言されています。ネストされたポリゴン構築のアイデアは何ですか?バグプロットであるポリゴンはどれですか(中央またはポイントの平均数を保持)。バグプロットのエッジには、いくつかの有用なプロパティがありますか(特にポイントセットを分割するなど)?
私は箱ひげ図の多次元(ここでは2変量)バージョンを紹介する論文を見つけました。そのバグプロットは正確には何ですか?頂点に基づいてネストされた一連のポリゴンを確認できます。これらのポリゴンの1つはバグプロットとして宣言されています。ネストされたポリゴン構築のアイデアは何ですか?バグプロットであるポリゴンはどれですか(中央またはポイントの平均数を保持)。バグプロットのエッジには、いくつかの有用なプロパティがありますか(特にポイントセットを分割するなど)?
回答:
これがメモ付きの例です:
こちらの記事であるThe Bagplot: A Bivariate Boxplot
から、ピーター・J. Rousseeuw、井田ラッツ&ジョン・W. TukeyのことでThe American Statistician
:http://venus.unive.it/romanaz/ada2/bagplot.pdfは、
その記事の要約から:
「深さの中央値」は最も深い場所であり、最大の深さを持つn / 2観測を含む「バッグ」で囲まれています。バッグを係数3で拡大すると、「フェンス」が作成されます(プロットされません)。バッグとフェンスの間の観測は薄い灰色のループでマークされますが、フェンスの外側の観測は異常値としてフラグが立てられます。バグプロットは、データの位置、広がり、相関、歪度、および裾を視覚化します。
ここに主要な部分の図があります:
追加の議論は以下にあります:
パッケージのヘルプドキュメントからaplpack
(R
ユーザー向け):
バグプロットは、よく知られたボックスプロットの2変量一般化です。Rousseeuw、Ruts、およびTukeyによって提案されました。2変量の場合、箱ひげ図の箱は、袋ひげ図の袋である凸包に変わります。バッグの中は全ポイントの50%です。フェンスは、フェンス内のポイントを外側のポイントから分離します。バッグを増やすことで計算されます。ループは、フェンス内のすべてのポイントを含む凸多角形として定義されます。すべての点が直線上にある場合、古典的な箱ひげ図になります。bagplot()は、Rousseeuwらで説明されているものと非常によく似たバグプロットをプロットします。備考:2次元の中央値は概算です。小さなデータセットには既知の問題があります(ただし、たとえば10ポイントの(グラフィック)要約を作成するのは賢明ではないと思います。)
人々が複数の(overlappIng)バグプロットをプロットしたい場合、プロットが半透明であれば便利です。このため、透明度フラグがbagplotコマンドに追加されました。transparent == TRUEの場合、アルファレイヤーは '99'(16進数)に設定されます。これにより、バグプロットが半透明になりますが、出力デバイスがPDFで、pdf(file = "filename.pdf"、version = "1.4")を使用して開いた場合のみです。このため、デフォルトは透明度== FALSEです。この機能と異なる色を指定するための引数は、Wouter Meulemanによって提案されました。
そして例:
library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight",
ylab="Miles Per Gallon",
main="Bagplot Example",
transparency = TRUE,
show.whiskers = FALSE,
# note that data a 'fence' separates inliers from outliers,
# and a 'loop' indicates the points outside the bag but
# inside the fence. In the 'bag' are 50 percent of all
# points
show.loophull = TRUE, # draw 'loop'?
show.baghull = TRUE) # draw 'bag'?
関連する質問: