尖度のロバストな推定?


11

尖度の通常の推定量であるを使用していますが、経験的分布では小さな「外れ値」でさえあることに気付きました、つまり中心から離れた小さなピークは、それを大きく影響します。より堅牢な尖度推定器はありますか?

K^=μ^4σ^4

回答:


8

いくつかあります。このリンクには、論文のゲートされていないバージョンとの完全な比較があります (この回答の下部に適切な参照があります)。

問題の制約のため、これらのアルゴリズムの最も堅牢な(L / RMC)の内訳は最大で12.5%です。L / RMCの利点は、それが変位値に基づいており、基礎となる分布にモーメントがない場合でも解釈可能なままであることです。別の利点は、テールウェイトを測定するためにデータの汚染されていない部分の分布の対称性を仮定しないことです。実際、アルゴリズムは2つの数値を返します。右テールウェイトのRMCと左テールウェイトのLMCです。

推定量のロバスト性は、そのブレークダウンポイントによって測定できます。ただし、この場合、ブレークダウンポイントの概念は複雑です。直感的には、この推定量を任意の値(推定量が返すことができる値の範囲内の任意の値として理解される)にするために、敵がサンプルの少なくとも12.5%を制御する必要があることを意味します。テールの重みは常にています。たとえば、アルゴリズムによって-1が返されることはありません。実際には、サンプルの約5%を非常に病理学的な外れ値で置き換えても、汚染されていないサンプルの値から最も影響を受ける推定値(常に2つあります)を大きく逸脱させることがないことがわかります。[0,1]

L / RMCも広く実装されています。たとえば、ここで Rの実装を見つけることができます 。上記のリンク先の記事で説明したように、L / RMCを計算するには、データの左半分と右半分で別々にMC(リンクに実装されている推定器)を計算する必要があります。ここで、(左)右半分は、元のサンプルの中央値よりも大きい(小さい)観測で形成されたサブサンプルです。

  • ブリス、ヒューバート、シュトルイフ。(2006)。テール重量の堅牢な測定。

2
言うまでもなく、尖度のロバストな推定量ではなく、これらの尾の重量の代替指標ではありませんか?これは彼が本当に望んでいることかもしれません。しかし、それは彼が要求したものとは正確には異なります。これらの推定量のいずれか/すべてが大きなサンプルの尖度に収束しますか?
andrewH 2015年

論文の要約:汚染されていないデータでは、Van Zwet(尖度の測定値が意味を持つ)の凸順の条件を満たし、データは尖度の単調関数に収束します。
user603 2015年

1
ピアソンの尖度は、外れ値(まれな極端な観察)を、単純明快に測定します。代わりに何を探していますか?「ピーク度」の尺度?まず、それはピアソンの尖度測定ではまったくありません。第2に、「ピーク度」の測定値が必要な場合は、まずそれが何を意味するかを定義する必要があります。定義できれば見積もることができます。1つの可能性は、ピーク時に評価された、標準化されたデータのpdfの2次導関数です。(どういたしまして)。他にもあると思います。
Peter Westfall 2017年

1
実際、尖度を分布の裾に関連付ける3つの数学的定理を与えるので、これらを改ざんすることはできません。 ))およびE(Z ^ 4 * I(| Z |> 1))+1。(ii)Z ^ 2の密度が連続的で、(0,1)で減少するサブクラスでは、「+ 1」は「+.5」に置き換えることができます。(iii)尖度->無限、E(Z ^ 4 * I(| Z |> b))/尖度-> 1の分布のシーケンスについて、任意の実数b。それはすべてここにあります:ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Peter Westfall
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.