「バグプロット」または「二変量ボックスプロット」とは何ですか?


11

私は箱ひげ図の多次元(ここでは2変量)バージョンを紹介する論文見つけました。そのバグプロットは正確には何ですか?頂点に基づいてネストされた一連のポリゴンを確認できます。これらのポリゴンの1つはバグプロットとして宣言されています。ネストされたポリゴン構築のアイデアは何ですか?バグプロットであるポリゴンはどれですか(中央またはポイントの平均数を保持)。バグプロットのエッジには、いくつかの有用なプロパティがありますか(特にポイントセットを分割するなど)?


3
これらを説明するアメリカの統計学者のRousseeuw、PitsおよびTukeyによる記事があります。なんらかの理由で、リンクの貼り付けに問題がありますが、グーグルの「バグプロット」と「テューキー」はそれを見つけます
ピーターフロム-

1
法外な価格でそれを見つけました。まだ探している。
mbaitoff 2012年

1
きちんとしたライブラリにアクセスできる場合は、ライブラリも必要です。アメリカの統計学者はかなり広く購読しています。クォーラにも何かがありましたが、私はそれを見ませんでした。
ピーターフロム-モニカの復活

2
RousseeuwとRutsは、アメリカの統計学者のほかに、ポストスクリプト形式の無料の記事をオンラインで公開しています。
アンディW

@ AndyW、SPSSフェローとしてあなたに質問:GPLを介してそれを行うことがどうして可能だと思いますか?私たちのSPSSersのためにコードを発明するつもりですか?
ttnphns

回答:


13

これがメモ付きの例です:

こちらの記事であるThe Bagplot: A Bivariate Boxplotから、ピーター・J. Rousseeuw、井田ラッツ&ジョン・W. TukeyのことでThe American Statisticianhttp://venus.unive.it/romanaz/ada2/bagplot.pdfは、

その記事の要約から:

「深さの中央値」は最も深い場所であり、最大の深さを持つn / 2観測を含む「バッグ」で囲まれています。バッグを係数3で拡大すると、「フェンス」が作成されます(プロットされません)。バッグとフェンスの間の観測は薄い灰色のループでマークされますが、フェンスの外側の観測は異常値としてフラグが立てられます。バグプロットは、データの位置、広がり、相関、歪度、および裾を視覚化します。

ここに主要な部分の図があります:

ここに画像の説明を入力してください

追加の議論は以下にあります:

パッケージのヘルプドキュメントからaplpackRユーザー向け):

バグプロットは、よく知られたボックスプロットの2変量一般化です。Rousseeuw、Ruts、およびTukeyによって提案されました。2変量の場合、箱ひげ図の箱は、袋ひげ図の袋である凸包に変わります。バッグの中は全ポイントの50%です。フェンスは、フェンス内のポイントを外側のポイントから分離します。バッグを増やすことで計算されます。ループは、フェンス内のすべてのポイントを含む凸多角形として定義されます。すべての点が直線上にある場合、古典的な箱ひげ図になります。bagplot()は、Rousseeuwらで説明されているものと非常によく似たバグプロットをプロットします。備考:2次元の中央値は概算です。小さなデータセットには既知の問題があります(ただし、たとえば10ポイントの(グラフィック)要約を作成するのは賢明ではないと思います。)

人々が複数の(overlappIng)バグプロットをプロットしたい場合、プロットが半透明であれば便利です。このため、透明度フラグがbagplotコマンドに追加されました。transparent == TRUEの場合、アルファレイヤーは '99'(16進数)に設定されます。これにより、バグプロットが半透明になりますが、出力デバイスがPDFで、pdf(file = "filename.pdf"、version = "1.4")を使用して開いた場合のみです。このため、デフォルトは透明度== FALSEです。この機能と異なる色を指定するための引数は、Wouter Meulemanによって提案されました。

そして例:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

ここに画像の説明を入力してください

関連する質問:


4
更新:誰かがこれのためにggplot2 geomを作成しました:gist.github.com/benmarwick/00772ccea2dd0b0f1745。たぶん進取的なユーザーはこれをパッケージに変えることができますか?
シャドウトーカー2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.