テストデータの大規模なデータセットを生成するツール[終了]


25

効率的なデータベース設計を考えようとするとき、2つのサンプルデータベースを構築し、それらにデータを入力し、それらに対していくつかのクエリを実行して、どちらのパフォーマンスが優れているかを確認することが最善の方法です。

(理想的にはデータベースに直接)大規模(〜10,000レコード)のテストデータセットを比較的迅速に生成するツールはありますか?少なくともMySQLで動作するものを探しています。

回答:


12

最適なツール(見つけることができる場合)はDataFactoryです。(残念ながら絶版)。私はそれから絶対に楽しい(そして非常に本物そっくりな)データセットを生成しました。

Generatedata.comは...受け入れられますが、あまりうまくスケーリングしません。

DataGenerator注目すべきものです。

また、DTM Data Generatorは不格好で、DataFactoryの代替品としては不十分ですが、DTM Data Generatorは存在し、販売されています。



4

通常、入力として既知のデータを使用して独自のデータを生成します。ランダムすぎる場合、常に良いテストではありません。最終製品と同様に配布されるデータが必要です。

調整する必要がある大規模なデータベースはすべて科学的な性質を持つため、通常は入力として他の調査を行い、それを再スケーリングしてジッタを追加できます。(たとえば、ミリ秒の精度で5分のリズムでデータを取得し、ミリ秒の精度で10秒のリズムに変換しますが、時間に対して+/- 100ミリ秒のジッタ)

...

しかし、別の代替手段として、独自に作成したくない場合は、いくつかのベンチマークツールを確認することです。トレーニングセットに基づいて何度も何度も繰り返すことができるため、それらを使用してロットを挿入できますレコードの(そして、それがどれだけ速くなったかに関するレポートを無視します)...そして、同じツールを使用して、データベースにデータが取り込まれた後の速度をテストできます。





1

最も費用対効果の高い方法は、おそらくオープンソースまたは商用データジェネレーターを使用することです。以前はそうしていました。

今、私の黄金時代に、私はテストデータのそれぞれの必要性を、別のスクリプト言語を学ぶための使命と考えています。


1

この問題の別の解決策を探している人のために... Data Synchronization Studioのテストデータジェネレータープロジェクトを書きました。1〜1億の現実的なテストデータの行に及ぶ大きなデータセットを生成できます。これについてのブログ記事はこちらです。http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync 15日間無料で使用できます(テストデータを入手したら、それを入手できます)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.