数値コードの結果のデータベース


17

数値的手法の文献では、多くの研究論文は、新しいアルゴリズムのバリエーションの説明と、それに続く1つまたは2つの既存の手法と比較するいくつかのテスト問題で構成されています。これにより、判断が困難になります

  • 関心のある他の問題に対する新しい方法の実行方法
  • 新しい方法がさらに他の既存の方法と比較する方法

もちろん、これらの質問の両方は、通常、新しい方法を採用するかどうかを決定する誰かにとって重要です。この状況を改善するには、可能であれば、メソッドを使用して多数のテスト問題(この質問を参照)を実行し、他のメソッドと比較するためにデータベースに結果をカタログ化することが望ましいと思われます。科学者またはエンジニアは、データベースに対してクエリを実行し、おそらくそれらにとって最も重要なソリューション/問題の特性(精度、効率、定性的特性など)を示し、データベース内のすべてのメソッドのパフォーマンスを定量的に比較できます。

このアイデアの実装には多くの困難があることを認識しています(主に、人々にこれらすべての問題を実際に実行させ、計算コストを測定します)。しかし、私の質問は次のとおりです。結果のそのようなデータベースは存在しますか?(特定のサブフィールドなど)またはこのようなアプローチはどこでも実装されていますか?

これまでに投稿された回答はどちらも、問題のデータベースに関するものです。私は結果のデータベースについて尋ねています。

回答:


9

あなたが指定した基準のうち、私が知っている最も近いプロジェクトはフロリダ大学のスパースマトリックスコレクションでしょう。人々は日常的にこのデータセットを使用してスパース線形代数ソルバーを比較し、アプリケーション、非ゼロの数、行列の次元などで、本当に素晴らしいWebインターフェイス、MATLABインターフェイス、またはJava GUIでフィルタリングできます。これらの問題の表を、4〜8個の線形代数ソルバーとのソルバーの実行時間の比較とともに、論文にリストしています。

このようなデータベースをコンパイルすることは有用であることに同意します。さらに、データをコンパイルするためのUFスパースマトリックスコレクションアプローチは優れたものであり、このアイデアを実現しようと考えている人にとって素晴らしい出発点になると思います。実際には、すべての問題を実行することは、すべてのソルバーにアクセスできる限り、大きな困難とは思えません。ソルバーにアクセスでき、必要なソフトウェアがすべてインストールされた信頼性の高い標準参照マシンがある場合、スクリプトを実行してデータを収集する必要があります。私の考えでは、困難は、オープンソースでなければ、人々にソフトウェアを提供してもらうことです。商用の場合は、購入するか、場合によっては人々にソフトウェアを寄付してもらうこともできますが、COIN-ORプロジェクト。しかし、それが商用でもオープンソースでもない研究ソフトウェアである場合は、人々にその努力に賛同するよう説得する必要があります。

最適化には、ダウンロード可能な問題のデータベース(CUTEr が思い浮かぶ)と最適化のためのテスト問題の本があることも知っています。プレゼンテーションの問題のデータベースで、最適化ソルバーと他のソルバーを比較する人々(たとえば、特にAIChE 2011でのRuth Misenerの講演を考えています)を見てきました。何が公開されているのかわかりません。大規模な比較のための最適化には伝統があることを知っています(多くのソルバー、多くの問題)。利用可能なオンラインデータベースがあるとは思わない。

私が重要だと思うもう1つのことは、ここでメソッドソフトウェア実装を区別することです。科学計算では、計算の複雑さの指標やさまざまな問題の経験などに基づいて、どのメソッドが高速か低速かについて話し合います。ただし、計算時間を定量的に測定する場合、特定のアルゴリズムでFLOPの数をカウントしない限り、アルゴリズムをソフトウェアに実装してから何らかの方法でパフォーマンスを測定する必要があります(メモリ使用量、実行時間など) 。)。計算の複雑さやFLOPカウントを調べるときにメソッドのパフォーマンスを評価するのは理にかなっています。なぜなら、そうしたことを測定するための実装は必要ないからです。しかし、実際の壁時計の実行時間に興味がある瞬間は、抽象的で口語的なデバイスとしてのみ有用です。(例えば、

このようなデータベースでは、時間の経過に伴うソフトウェアの改善を追跡できる可能性もあるため、メソッドとソフトウェアのこの区別を取り上げます。したがって、たとえば、PETSc、PyCLAW、またはテストされているソフトウェアなどの場合、ソフトウェアのアップグレードによってどのような問題がプラス(またはマイナス!)に影響されるかを見るのは興味深いでしょう。これは、コードをアップグレードするのにお金と人的資源の潜在的なコストに見合う価値があるかどうかを判断しようとする研究者にとって有用です。このような区別が重要であるもう1つの理由は、優れたメソッドを不適切に実装できるためです。この可能性は、人々が自分の研究コードを共有する際にときどき持っているre黙に寄与すると思います。

このアイデアから生まれたものは何でも(そして、何かが生まれて、博士号の後に貢献してくれることを望んでいます)、ソフトウェアとメソッドの違いを強調することが重要だと思います。ソフトウェアの結果を投稿する予定です。


2
私はあなたのコメントがとても好きです、そして、あなたは重要なポイントを上げます。ご承知のとおり、あなたが提供するリンクは、結果ではなく問題のデータベースへのものです。
デビッドケッチャソン

それらは私が見つけることができる最も近いものでした。あなたが本当に重要なアイデアを提起したと思うので、結果のデータベースを探し回ってみましたが、見つけられませんでした。おそらくこれは重要な新しいプロジェクトですか?
ジェフオックスベリー

ありがとう。私は同意し、これらはあなたが言うように「最も近い既存の近似」として有用です。私は実際にこれを(より信頼性を高める他の人たちと一緒に)新しいプロジェクトとして考えています。私はあなたが興味を持っていることを非常にうれしく思います!SEは議論を嫌うため、他の場所で議論することができます。
デビッドケッチャソン

4

「困難な」積分のリストを作成して数値計算を試みました(Walter Gautschi、R​​obert Piessensなどの論文を参照)が、正式なデータベースはありません。

ODEのフィールドには、初期値問題のテストセットであるIVPテストセットがあります。


実際、私は問題のデータベースではなく、計算結果のデータベースについて尋ねています。
デビッドケッチャソン

1
@DavidKetcheson結果の計算を自分で自動化するためのドライバーコードが含まれています。
ジェッドブラウン

すごい!結果が保存されている実際のデータベースを見たいのですが(もちろん、それらを再計算する機能に加えて)、これは私が考えていたものに最も近いものです。
デビッドケッチャソン

3

私はそのようなデータベースに精通していませんが、有用な方法で定義することは非常に難しいと思います。私の意見では、より良いシステムは、実行可能な形式でコードをリリースして、ユーザーが好きなだけ包括的にテストできるようにすることです。コミュニティリポジトリに関しては、GertVdEが言及しているIVPテストスイートには、テスト問題で公開されたいくつかのODE / DAEソルバーを実行するためのドライバーコードも含まれています。私の出版物では、出力データを分析し、紙に表示されるプロットと表を作成するために使用されるコードとすべてのスクリプトをリリースしようとします。


1
小さな口論:これは答えではなくコメントです。しかし、批判的思考には感謝しています。私は人々が両方をするのを見たいです。結果を私のものに対してプロットできるように、なぜコードをインストールして実行するのですか?そして、あなたは私が正しいオプションを設定しなかったと主張することができますか?とにかく、私(典型的な研究者を意味する)は、それがあまりにも多くの仕事であるので、ちょうどそれをしません。しかし、私がしなければならないのがデータファイルの読み取りだけであれば、喜んでもかまいません。
デビッドケッチャソン

1

ベンチマーク問題に関する計算空力音響ワークショップは、空力音響問題について同様の目標を念頭に置いています。最初に事前に一連のベンチマーク問題を提示し、独自の方法を使用してそれらを解決し、結果を比較します。たとえば、4回目の会議の議事録は次のとおりです。http//www.archive.org/details/nasa_techdoc_20040182258

私が伝えることができることから、彼らは彼らのコードがお互いに対してどれほど効率的であるかを比較しませんが、彼らは主に正確さを見ます。


面白い!ソリューションのデータベースはありますか?または、結果をどのように正確に比較しますか?
デビッドケッチャソン

「データベース」は、私が投稿したレポートにあります。論文の最後に「ソリューションの比較」というタイトルのセクションがあります。この会議は4回しかありませんでしたが、最後の会議は2004年でした。あなたが提案するように、これらの種類の物事をオンラインにするためのさらなる推進があればいいのにと思います。
ジェームズカスター

1

地震モデリングでは、こうした努力がいくつか行われています。思い浮かぶのは、動的破壊シミュレーションプロジェクトとソース反転プロジェクト(http://eqsource.webfactional.com/wiki/)です。これらの両方は、解決する物理的な問題を提供し、採用された方法に関して(あるレベルで)不可知です。実際、これらのプロジェクトは、ドメイン固有のモデラーを相互に比較するためのものであり、実際にはすべての数値pdesメソッドの一般的なテスト問題のセットではありません。しかし、他の結果と比較することができ、これにより多くのコードで多くの問題が明らかになりました。

見る可能性の1つは、地震イメージングの世界で開発されたマダガスカルプロジェクトですが、非常に一般的な目的であると主張しています。


マダガスカルは素晴らしい例です。ありがとうございました!
ジャックポールソン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.