回答:
基本的に、問題は
(そしてもちろんe ^ {-1} = 1 / e \ approx 1/3、少なくとも大体)。
非常に小さいnでは機能しません。たとえば、、です。それは通過で、通過で、およびすることによって。n = 11を超えると、は\ frac {1} {3}よりも優れた近似になります。
灰色の破線はます。赤と灰色の線はます。
(簡単に見つけることができる)正式な派生を示すのではなく、(少し)より一般的な結果が成り立つ理由の概要(直観的で、波打った引数)を示します。
(多くの人はこれを定義とますが、をとして定義するなどの簡単な結果から証明できます。)
事実1:これは、べき乗とべき乗に関する基本的な結果から得られます
事実2:が大きい場合、これは級数展開から得られます。
(私はこれらのそれぞれについてより完全な議論をすることができますが、私はあなたがすでにそれらを知っていると仮定します)
(1)の(2)を置き換えます。できた (これをより正式な議論として機能させるには、Fact 2の残りの項が乗したときに問題を引き起こすほど大きくならないことを示す必要があるため、多少の作業が必要になります。しかし、これは直観です。正式な証拠ではありません。)
[または、のテイラー級数を1次にするだけです。2番目の簡単なアプローチは、の二項展開を取得し、用語ごとに制限を取得することです。これにより、系列の項が表示されます。。]
したがって、、置き換えます。
すぐに、この回答の先頭に結果が表示されます。
gungがコメントで指摘しているように、あなたの質問の結果は632ブートストラップルールの起源です
例
Efron、B. and R. Tibshirani(1997)、
"Improvements on Cross-Validation:The .632+ Bootstrap Method、"
Journal of the American Statistical Association Vol。92、438.(Jun)、pp。548-560
より正確には、各ブートストラップサンプル(またはバギングツリー)には、サンプルのが含まれます。
ブートストラップの仕組みを見ていきましょう。私たちは、元のサンプル持ってして、その中のアイテム。サイズ別のセットが得られるまで、この元のセットから置換されたアイテムを描画します。
それから、最初のドローで1つのアイテム(たとえば)を選択する確率はます。したがって、そのアイテムを選択しない確率はです。これは最初の引き分けです。合計ドローがあり、それらはすべて独立しているため、ドローのいずれかでこのアイテムを選択しない確率はです。
次に、が大きくなるとどうなるかを考えてみましょう。通常の微積分トリック(またはWolfram Alpha)を使用して、が無限大に向かうにつれて制限をとることができます:
これは、アイテムが選択されない確率です。1からそれを減算して、選択されているアイテムの確率を見つけます。これにより、0.632が得られます。
置換によるサンプリングは、「成功」が選択されているインスタンスである二項試行のシーケンスとしてモデル化できます。インスタンスの元のデータセットの場合、「成功」の確率はであり、「失敗」の確率はです。サンプルサイズがの場合、インスタンスを正確に回選択する確率は、二項分布で与えられます。
ブートストラップサンプルの特定の場合、サンプルサイズはインスタンスと等しくなります。まかせアプローチの無限大を、我々が得ます:
元のデータセットが大きい場合、この式を使用して、ブートストラップサンプルでインスタンスが正確に回選択される確率を計算できます。以下のために、確率は、またはおおよそ。したがって、インスタンスが少なくとも1回サンプリングされる確率はです。
言うまでもなく、私はこれをペンと紙を使って苦労して導き出し、Wolfram Alphaを使用することさえ考えませんでした。