実験データが裾の重い分布に従っていることをどのように証明できますか?


9

サーバーの応答遅延に関するいくつかのテスト結果があります。理論分析によると、遅延分布(応答遅延の確率分布関数)は、裾が重い動作になるはずです。しかし、テスト結果がヘビーテール分布に従っていることをどのように証明できますか?

回答:


12

あなたの質問を正しく解釈しているかどうかわからないので、お知らせください。この回答を採用または削除することができます。まず、データに関することを証明するのではなく、何かが不合理ではないことを示します。これはいくつかの方法で行うことができますが、その1つは統計的検定によるものです。ただし、私の意見では、事前に指定された理論的分布がある場合、最善のアプローチはqq-plotを作成することです。ほとんどの人は唯一の正規性を評価するために使用されているようQQプロットを考えていますが、反対経験的分位プロットすることができます任意の指定することができる理論的な分布を。Rを使用する場合、carパッケージには拡張関数qq.plot()があります。素晴らしい機能がたくさんあります。私が気に入っている2つは、ガウス分布だけでなく、いくつかの異なる理論的分布を指定できること(たとえば、よりt太い代替案を作成できること)と、95%の信頼帯をプロットすることです。あなたが特定の理論分布を持っていますが、単に表示したくない場合はテールはノーマルから予想以上に重くしている場合、それは可能 QQプロットに見られることが、時々認識するのは難しいことができます。私が気に入っている可能性の1つは、カーネル密度プロットとqq-plotを作成することです。その上に正規曲線をオーバーレイして起動できます。基本的なRコードはplot(density(data))です。数については、尖度を計算できます、予想よりも高いかどうかを確認します。私はRの尖度の缶詰関数を知りません、あなたはリンクされたページで与えられた方程式を使ってそれをコード化しなければなりません、しかしそれをすることは難しくありません。


5
+1良いアドバイスと良い議論。しかし尖度は低いですか?より高いという意味ですか?次のことを(Rで)試すことができlibrary(moments); apply(matrix(1:5,5,1), 1, function(p) kurtosis((1:100)^p))ます。より高いパワーで右尾が伸びるにつれて、尖度がどのように増加するかに注意してください。
whuber

おっとっと。@whuber、キャッチありがとうございます。答えを編集しました。
ガン-モニカの復活

2
私たちは物事を証明しません[...]何かが不合理ではないことを示すだけです。引用する文章!
Simone

e1071中のパッケージには含まれていkurtosisますが、ここで使用できる機能を。
Keith Hughitt、2015
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.