計算作業で使用しようとしているソフトウェアの品質を評価する際に(それがあなたが書いたものであるか、缶詰のパッケージであるかを問わず)、標準のデータセットまたは問題でどの程度うまく機能するかを確認することはしばしば良い考えです。計算ルーチンを検証するためのこれらのテストはどこで入手できますか?
(回答ごとに1つのウェブサイト/本をお願いします。)
計算作業で使用しようとしているソフトウェアの品質を評価する際に(それがあなたが書いたものであるか、缶詰のパッケージであるかを問わず)、標準のデータセットまたは問題でどの程度うまく機能するかを確認することはしばしば良い考えです。計算ルーチンを検証するためのこれらのテストはどこで入手できますか?
(回答ごとに1つのウェブサイト/本をお願いします。)
回答:
スパース行列の分析を行うことに興味がある場合は、デイビスのフロリダ大学スパース行列コレクションと行列市場も検討します。
グラフ分割アルゴリズムをテストするために、WalshawのGraph Partitioning Archiveがあります。
計算電磁気学では、テスト問題の有名な(またはいくつかの難しさのために悪名高い)セットがあります:電磁分析法(TEAM)のテスト。
それらのいくつかは、実験データと整合した正しいシミュレーション結果を得るために、真剣に最先端の数値技術を本当に必要とします。たとえば、導体コイルの問題。
Maxwell方程式のテスト問題の別のセットは、Daugeによってコンパイルされています。高度に特異な解の近似のためのMaxwell方程式のベンチマーク計算。有名な(または悪名高い)Ficheraキューブの1つ:
分子構造に関連するアルゴリズムのベンチマークに興味がある場合、pubchemデータベースには、ほとんどが有機分子の大規模なコレクションがあります。これは、異なるモデル/プログラムで取得した分子特性の予測を比較するのに役立ちます。このサイトには、事前定義された基準(化学組成など)を満たす分子の大きなバッチをダウンロードするためのいくつかのオプションがあります。
可愛いのウェブサイトには、最適化と線形ソルバーのためのいくつかの追加の問題でアーノルドNeumaierのウェブサイト上で述べたCUTEテストセットを更新します。さらに、線形代数と最適化ソルバーのテストと更新のためのソフトウェアツールを提供します。
双曲線保存則を解くかどうかのAthenaのテスト。
建物のエネルギーシミュレーションソフトウェアでは、気象データセットを使用しています。米国の場合、データセットは、先行する20年間にわたって1時間ごとに(通常は空港で)行われた気象観測で構成されます。
統計アルゴリズムをテストするために、DJ Hand、F。Daly、K。McConway、D。Lunn、およびE. Ostrowskiによる小データセットのハンドブックがあります。これらのデータセットの一部は、ここからダウンロードできます。
Hans MittelmanのWebサイトは、数値最適化における現在のソフトウェアオプションをナビゲートするための優れたリソースです。彼には、最適化のテスト問題に関する他のベンチマークへのリンクだけでなく、彼自身のベンチマークも含まれています。
Alan Genzは、多次元統合ルーチンのテストペーパーで、機能のテストスイートを提案しました。このペーパーのオンライン版は見つかりませんが、CUBAライブラリーに関するペーパーで参照できます。
TU-ChemnitzのRoland Herzogによって維持されている参照PDE制約付き最適化問題のコレクションがここにあります。
良いソフトウェアはテストされていなければならず、作者がどのようにテストし、テストデータセット自体を(例えば、回帰テストの形で)提供するか、少なくともテストされたデータへのリンクを提供する必要があります。
テストする大きなグラフまたはネットワークデータを探している場合。スタンフォードネットワーク解析プロジェクト(SNAP)は、典型的には匿名隣接リストの形で多くの大規模なグラフデータセットを有しています。オプションには次のものがあります。
データは簡単です。それを取得するためのAPIは困難です。Quandlをお勧めします。このサイトには、1つの簡単でRESTに対応したAPIを介してアクセスできる、公開されている1,000万を超えるデータセットがあります。すべてのデータはCSVまたはJSONで返されます。または、プログラミングがあなたの強みではない場合、データをExcelに取り込む簡単な方法があります。R、Python、Rubyのプログラマーは、ネイティブライブラリをすぐに使用できます。