ブートストラップの統計の「滑らかさ」?


7

統計が「スムーズ」ではないということの意味を誰かが説明できるかどうか疑問に思っていました。

たとえば、2.6.2 p。DavisonとHinkleyの 41人は、「標準の展開理論が適用されないように、サンプルにスムーズでないまたは不安定な方法で依存している」という統計について話します。

また、サンプルモーメントの微分可能な関数である関数についても触れていますが、これが「スムーズ」なのかどうかはわかりません。

もしそうなら、そのフレーズの意味を説明できますか?

回答:


6

これは、私が知る限り、本質的に、統計用語ではなく、数学用語に関する質問です。

いずれにせよ、統計はサンプルの微分可能な関数ではない、またはサンプルの倍の連続微分可能な関数ではないことがポイントです。n

言い換えると、サンプルの変化に対する統計の応答が理想的ではない、またはデータの線形関数または多項式関数のように、見た目が不快(つまり、用語が「滑らか」)である場所がある可能性があります。決して持つことができませんでした。

Wikipediaのページ円滑な機能については、ポイントでおそらく不必要な技術ですが、うまくいけば絵の一部と拡張の議論はあなたの用語「滑らかさ」によって喚起されることになって何のためにいくつかの直感を与えることができます。

特定の関数が「サンプルモーメントの微分可能な関数」である場合、そのコンテキストで「スムーズ」がどのような意味で使用されているかによって、サンプルモーメントのスムーズな関数になる場合があります。ほとんどの場合、「スムーズ」は無限に何度も連続的に微分可能であることを意味するために使用されます(たとえば、多項式または線形関数または正弦と余弦のように)。ただし、Wikipediaのページで言及されているように、この用語はそれほど厳密ではない意味で使用できます。

いずれにせよ、それが微分可能性に関連していることは間違いなく正しいです。それが鍵となる考えです。

また、連続的であるが「スムーズ」ではない関数が存在することにも注意する必要があります。つまり、連続性は一般に優れた規則性のプロパティですが、多くの場合、望ましくない病理学的な振る舞いを多く許容しますが、そのような病理学的な振る舞いはできません。連続関数よりもさらに優れているため、滑らかな関数で発生します。

例:たとえば、正規直交共変量を持つLASSO推定器を考えます。

β^j=SNλ(β^jOLS)=β^jOLSmax{0,1Nλ|β^jOLS|},
ここで。β^OLS=(XTX)1XTy=XTy

まず、我々は注意しての座標に線形であり及びのでで線形であり及びように、(仮定そのまたははサンプルを表します)はすべて完全に滑らかな関数であり、非滑らかさの原因ではありません。代わりに、滑らかさの、の定義にある最大関数由来します。以下で説明します。β^jOLSXyβ^OLSXyXyβ^jOLSmaxβ^j

アイデンティティー(ここで説明および証明)を使用して、上記の式を次のように書き換えます:max{x,y}=x+y+|xy|2

β^j=β^jOLS2[(Nλ|β^jOLS|1)+|Nλ|β^jOLS|1|]={0,when Nλ|β^OLS|1β^jOLS(1Nλ|β^jOLS|),when Nλ|β^OLS|1

この形式で書かれていると、滑らかでない動作の原因として少なくとも2つ考えられる原因があることは明らかです。(1)場合、分母が消えます(2)ポイントと可能な尖点 もちろんこれらの点では、2つの異なる関数「結合」ですこれは、であるポイントで同じ値であっても β^jOLS=0

Nλ|β^jOLS|=1Nλ=|β^jOLS|,
β^j(0 and β^jOLS(1Nλ|β^jOLS|))Nλ=|β^jOLS|は、左側と右側の導関数がすべてのについて一致するような方法で、必ずしも「うまく再生する」とは限りません。これが失敗する関数の最も基本的な例は、値:最初の左側の導関数は、最初の右側の導関数はであるため、では滑らかではありません。であるこれらのポイントで、関数に類似の現象が発生する可能性があると思います 、がその入力の滑らかな関数にならないようにします。n|x|x=011x=0β^jNλ=|β^jOLS|β^j

関数は、スムーズであると見なされるために、入力引数に関してのみスムーズである必要があります。おそらく、その入力引数はサンプル自体、またはサンプルの一部の関数です。場合関数の関数であるそしてある得る組成物によって、サンプルの GET新しい機能スキップこと仲介者(つまり、関心のある同じ出力を返し、直接サンプルの関数です)。連鎖規則により、この構成された関数は、両方の関数とβ^jgβ^jgβ^jgβ^~jβ^~j=β^jgβ^jg 滑らかです。


回答ありがとうございます!誰かが簡単な統計のためにこれをチェックする方法の例を誰かが与える可能性はありますか?統計の「サンプルの変化」がわかりにくい部分を見つけました。サンプル内で統計がどのように変化するかわかりませんか?どの関数がどの変数に関連して差別化されるのか明確にわかりませんか?
2016年

@Bee私は何も約束しませんが、あなたが参照している文章(特に問題の統計の定義)をタイプすると、私はそれを見てみることができます。関数が滑らかでない1つの一般的な理由は、孤立した特異点です。たとえば、関数が分数で、分母がある点でゼロである場合です。あなたの統計はそうですか?en.wikipedia.org/wiki/Singularity_(mathematics)–
Chill2Macht

したがって、たとえば、Wikipediaで正規直交共変量が指定されたLASSO推定量は、 明らかにこの関数のmax()部分がいくつかの滑らかさの問題を引き起こす可能性がありますが、変化するものとしてのBolsの考えは...奇妙なコンセプト
Bee

ただb / c例のようにベータOLSを記述して適切に表示する方法がわかりません
Bee

1
@ウィリアム+1いい答え。結論がやや不足しています。統計がとの非平滑関数であるため、「したがって、分散を推定するために適用されたブートストラップは無効である」と私は思います。β^jXy
tomka 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.