統計とビッグデータ ellipse

信頼楕円の本当の意味

95％信頼楕円の真の意味について読むと、2つの説明に出くわす傾向があります。データの95％を含む楕円上記ではなく、データの分散を説明する楕円。正しく理解できるかどうかはわかりませんが、新しいデータポイントが入ってくると、95％の確率で新しい分散が楕円にとどまることを意味するようです。光を当てることはできますか？

12 confidence-interval ellipse

二変量中央値のデータと信頼 "楕円"（領域？）を見つけますか？

二変量中央値の周りのデータと信頼楕円を計算する方法について疑問に思っています。たとえば、次のデータの二変量平均のデータ楕円または信頼楕円を簡単に計算できます（ここではデータ楕円のみを示しています）。 library("car") set.seed(1) df <- data.frame(x = rnorm(200, mean = 4, sd = 1.5), y = rnorm(200, mean = 1.4, sd = 2.5)) plot(df) with(df, dataEllipse(x, y, level = 0.68, add = TRUE)) しかし、私は二変量中央値に対してこれをどのように行うのかと苦労していますか？単変量の場合、リストラップをブートストラップして必要な間隔を生成することができますが、これを二変量の場合に変換する方法がわかりませんか？ @Andy Wが指摘したように、中央値は一意に定義されていません。この例では、そのポイントでの観測間の距離のL1ノルムを最小化するポイントを見つけることにより、空間中央値を使用しました。観測されたデータポイントから空間中央値を計算するために最適化が使用されました。さらに、実際のユースケースにおけるx、yデータペアは、非類似度マトリックスの主座標分析の2つの固有ベクトルであるため、特定の攻撃手段を提供する場合、xとyは直交している必要があります。実際の使用例では、ユークリッド空間の点のグループのデータ/信頼楕円を計算します。例えば：分析は、グループ間の分散の均一性のリーベン検定の多変量類似体です。多変量中心傾向の尺度として空間中央値または標準グループの重心を使用し、空間中央値の場合の上の図のデータ楕円に相当するものを追加します。

7 r confidence-interval median bivariate ellipse

タグ付けされた質問 「ellipse」

タグ付けされた質問「ellipse」