既知の統計特性を持つ事前に生成された数値シリーズはありますか?


8

数値シーケンスのいくつかの統計的特性(平均、中央値、標準偏差など)を計算すると主張するプログラムをテストしようとしています。シンプルで短いシーケンスはテストに合格しますが、長いシーケンス、または大きな値と小さな値のシーケンス(オーバーフロー/アンダーフローをテストするため)などでプログラムに挑戦したいと思います。したがって、ソフトウェアやオンラインリソースなどがありますか既知の統計特性を持つさまざまな数値シーケンスのソース?

回答:


9

米国国立標準技術研究所は、一連の持つ統計リファレンスデータセットのラベルセットを含む「統計的手法のさまざまな認証値と参照データセットを提供します」、「単変量の要約統計」平均、標準偏差のための認証値とをし、 lag-1の自己相関。

中央値の値は含まれていないようですが、中央値の正確な計算は問題になりません。サンプル中央値の効率的な計算は少し難しいです。


これらのデータセットはかなり短いようです-最大で数千の値。長いシーケンス、およびオーバーフローと精度の損失をテストするためにいくつかの極端な値を持つシーケンスはありますか?また、歪度、尖度など、これらのセットで利用可能な「高次」の統計的特性はありますか?
mbaitoff

1

お気に入りの統計ツールボックス(私のものはR)を使用して、それを使用して長い時系列のデータの生成を開始できます。たとえばRでは、あらゆる種類の分布からデータを生成することができます。このようにして、テストしているこのプログラムが他の統計プログラムと一致していることを検証できます。それはパフォーマンスを例えばRと比較するだけですが、私はこの点でRを信頼します:)。


シーケンスだけでなく、落とし穴のあるシーケンスを探しています。配布の種類はここではあまり関係ありません。
mbaitoff 2011
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.