実際には、観測値が100の最小サンプルが1%変位値の推定量として使用されます。「経験的パーセンタイル」と呼ばれるものを見たことがあります。
既知の配布ファミリー
別の推定値が必要で、データの分布についてのアイデアがある場合は、次数統計中央値を確認することをお勧めします。たとえば、このRパッケージはそれらを確率プロット相関係数PPCCに使用します。あなたは彼らがノーマルのようないくつかのディストリビューションでそれをどのように行うかを見つけることができます。あなたは「通常、対数正規、およびガンベル分布的Hypotheseのための確率プロットの相関係数テスト」フォーゲルの1986年の論文で詳細を見ることができ、ここで、通常と対数正規分布のための統計中央値に。
たとえば、Vogelの論文Eq.2は、標準正規分布からの100個の観測サンプルのmin(x)を次のように定義しています。M_1
ここで、 CDFの中央値:
M1=Φ−1(FY(min(y)))
F^Y(min(y))=1−(1/2)1/100=0.0069
次の値を取得しますパーセンタイルの推定値を取得するために場所とスケールを適用できる標準法線の:。M1=−2.46μ^−2.46σ^
ここでこれが正規分布のmin(x)とどのように比較されるか:
一番上のプロットは1パーセンタイルのmin(x)推定量の分布で、一番下のプロットは私が見ることを提案したものです。以下のコードも貼り付けました。コードでは、正規分布の平均と分散をランダムに選択し、長さ100の観測値のサンプルを生成します。次に、min(x)を見つけて、正規分布の真のパラメーターを使用して標準正規にスケーリングします。M1メソッドの場合、推定平均と分散を使用して変位値を計算し、真のパラメーターを再び使用して標準にスケーリングします。この方法で、平均と標準偏差の推定誤差の影響をある程度説明できます。また、真のパーセンタイルを垂直線で示しています。
M1推定量がmin(x)よりもはるかにタイトであることがわかります。これは、真の分布タイプ、つまり正規分布の知識を使用するためです。まだ真のパラメーターはわかりませんが、分布族を知っていても、推定値は大幅に改善されました。
オクターブコード
ここでオンラインで実行できます:https : //octave-online.net/
N=100000
n=100
mus = randn(1,N);
sigmas = abs(randn(1,N));
r = randn(n,N).*repmat(sigmas,n,1)+repmat(mus,n,1);
muhats = mean(r);
sigmahats = std(r);
fhat = 1-(1/2)^(1/100)
M1 = norminv(fhat)
onepcthats = (M1*sigmahats + muhats - mus) ./ sigmas;
mins = min(r);
minonepcthats = (mins - mus) ./ sigmas;
onepct = norminv(0.01)
figure
subplot(2,1,1)
hist(minonepcthats,100)
title 'min(x)'
xlims = xlim;
ylims = ylim;
hold on
plot([onepct,onepct],ylims)
subplot(2,1,2)
hist(onepcthats,100)
title 'M1'
xlim(xlims)
hold on
plot([onepct,onepct],ylims)
不明な分布
データの出所がわからない場合は、財務リスクアプリケーションで使用される別のアプローチがあります。ジョンソン分布にはSUとSLの2つがあります。前者は、NormalやStudent tなどの無制限の場合で、後者は、対数正規などの下限の場合です。あなたはできるフィットその後、推定されたパラメータは、必要な分位数を推定使って、あなたのデータへのジョンソン分布を。Tuenter(2001)は、実際に一部で使用されているモーメントマッチングのフィッティング手順を提案しました。
min(x)よりも良いでしょうか?確かなことはわかりませんが、たとえば、分布はわかりませんが、下限がわかっている場合など、私の練習ではより良い結果が得られることがあります。