HastieのESL Bookからこの問題について5歳のように誰かが説明できますか?


9

私はHastieのESLブックに取り組んでいますが、質問2.3で苦労しています。質問は次のとおりです。

ここに画像の説明を入力してください

原点での最近傍推定を検討しています。原点から最も近いデータポイントまでの距離の中央値は、この方程式で与えられます。これを導き出そうとする場合、どこから始めればよいのかわかりません。

ほとんどのデータポイントが他のデータポイント(次元の呪い)よりもサンプル空間の境界に近いことを知っていますが、これを線形代数/確率の意味に変換するのに問題があります。

ありがとう!


4
タイトルの「ELI5」とはどういう意味ですか?その方程式を導出したい場合は、ボールのポイントの確率モデルから始める必要があります。そのモデルは何ですか?(読者の質問を理解するために、読者が本や他のサイトを参照するように要求しないでください。)
whuber

3
@whuber同意します-頭字語はひどいハッシュスキームです。
Sycoraxによると、モニカ

14
あなたは5歳です。ESLを理解したいと思ったことはすべてあなたの功績ですが、6歳になるまで待つ必要があります。それは大きな男の子と女の子のための本です。
Nick Cox

4
5歳の人は、1次元のケース(p = 1)を調べることから始めるかもしれません。そして、それが手に入ると、そこからそれを取ります。
マークL.ストーン

3
ELI5を詳しく説明する場合、ESLについてはどうでしょうか。
mdewey 2016

回答:


15

rV0[p]pr

V[r]=V0[p]rp

P=V[r]/V0[p]R=rp

P[R]=R

0R1RRp[R]=P[R]=1p

RPr[Rρ]=P[ρ]Pr[Rρ]=1P[ρ]Rminn

Pr[Rminρ]=Pr[Rρ]n=(1ρ)n

中央値の定義により、 が得られます。として書き換え ます。これは、目的の結果と同等です。

12=Pr[(Rmin)medR]=(1R)n
(1dp)n=12

編集:「ELI5」スタイルの回答を3つの部分で試みます。

  1. 単一点の1Dの場合、距離はに均一に分布するため、中央値はます。[0,1]12

  2. 1Dでは、ポイント上の最小値の分布は、乗の最初のケースです。nn

  3. 寸法、距離均一に分布されないが、あります。prrp


1
ハハ、私は5歳の人がp = 1のケースを見ることから始めるかもしれないというコメントをしました。私は、4歳の人がp = 1の場合から始まるだけでなく、n = 1の場合もあるかもしれないというコメントを追加することを考えました。
マークL.ストーン

1
私が質問に答えたとき、@ fcopがそれを読むことが明確にされた後だったことに注意してください。最も近いデータポイントは...によって与えられます。つまり、次元空間のノルムに関する単位球です。この後、質問は元の状態にロールバックされましたが、これは異なり、あまり明確ではありません。(元の質問の下のコメントチェーンを参照してください。) pL2p
GeoMatt22 '31
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.