数値誤差の科学的基準


40

私の研究分野では、実験誤差の仕様は一般に受け入れられており、それらを提供できない出版物は非常に批判されています。同時に、多くの場合、疑わしい数値手法が機能しているにもかかわらず、数値計算の結果が数値誤差の説明なしで提供されることがよくあります。数値計算などの離散化や有限精度に起因する誤差について話しています。確かに、これらの誤差の推定値は、流体力学方程式の場合のように、必ずしも簡単に取得できるわけではありませんが、数値誤差の推定値の仕様は、実験結果の場合と同じくらい標準的である必要があります。したがって、私の質問:

回答:


26

あなたの質問はモデル検証について尋ねています。あなたが検証し、検証のために検索することにより、多数の方法上のリソースや基準を見つけることができます(Roache 199720022004オベルカンフ&Trucano 2002Salari&Knupp 2000Babuska&おでん2004)、などのより広範な話題不確実性定量化。メソッドについて詳しく説明するのではなく、この問題について確固たる立場をとったコミュニティを強調したいと思います。

1986年には、Roache、GHIA、ホワイトは、確立されたコントロールの数値の精度に流体エンジニアリング編集方針声明のジャーナルで開きます

専門的な問題は、計算流体力学コミュニティと計算物理学のより広い領域に存在します。すなわち、数値精度の制御に関するより高い基準が必要です。

[...]問題は確かにJFEに固有のものではなく、1980〜81年のAFOSRHTTM-St​​anford Conference on Complex Turbulent Flowsでさらに焦点が絞られました。その会議の評価委員会の結論は、その会議への提出のほとんどで、異なる乱流モデルの精度を評価および比較することは不可能だったということでした。グリッド。これは、1次の正確なメソッドとハイブリッドメソッドの場合に特に当てはまります。

彼らは非常に直接的なガイドラインで締めくくります:

Journal of Fluids Engineeringは、系統的トランケーションエラーテストと精度推定のタスクに対処できない流体工学の問題の数値解を報告する論文の出版を受け付けません。

[...] 固定グリッドでの単一の計算は許容できないことを明確にする必要があります。そのような計算から精度の推定値を推測することは不可能だからです。また、編集者は、特に乱流モデリングのように調整可能なパラメーターが含まれる場合、実験データとの妥当な一致が十分な精度の証拠であるとは見なしません。

現在のバージョンでは、基準の包括的なセットが含まれていると、私の意見では、他のフィールドが一致することを熱望すべき標準を表します。今日でも、多くの分野でモデル検証の重要性に関する認識が欠如しているのは残念です。


1
調整可能なパラメーターに関する最後のポイントは、ジョン・フォン・ノイマンの引用を思い出させます。「4つのパラメーターで象にフィットし、5つのパラメーターで象を揺らすことができます」。
ジェドブラウン

これは離散化エラーの影響にのみ対処するものであり、丸めエラーの影響には対処しません。これらのエラーは、通常、合計エラーにはあまり寄与しないため、流体シミュレーションではほとんど例外なく無視されます。しかし、微分方程式や積分を含まないアプリケーションでは、離散化エラーはありません。これらの問題では、丸め誤差と反復切り捨て誤差が主な誤差の原因です。
アーノルドノイマイアー

厳密な事後推定により、グリッドの独立性要件を置き換えることができると思いますか?少し曖昧だと述べたように、独立性を確保するためにグリッドをどの程度改良しますか?一方、優れた事後推定量はあいまいさの余地を残してはなりません。
-Reid.Atcheson

2
@ Reid.Atcheson「あなたはエラー推定値が好きだと聞いたので、あなたのエラー推定値のエラー推定値を得たので、あなたのエラーを推定することができます...」最悪の場合の境界。利用可能な境界はしばしば悲観的であり、ほとんどのエンジニアリング問題に当てはまらない仮定に依存しています。最高のエラー推定器を使用しても、正しく実装されたことを確認する必要があります。エラー推定器をお持ちの場合は必ず使用してください。ただし、エラー推定器はスタンドアロンの検証ではありません。
ジェドブラウン

19

信頼できるエラーの見積もりは、多くの場合、おおよその計算よりもはるかに高いため、そのような標準は存在しません。

基本的に、4種類のエラー推定値があります。

(i)数値的手法が数値的に安定していることを証明する理論的分析。分析では、入力引数の定量化されたエラーよりもエラーが悪化しないことを保証しているだけなので、実際にはエラーバーはありません。入力も近似値にすぎないため、ほとんどの科学計算で十分です。したがって、数値的に安定した方法で作成されたエラーは、わずかに異なる(ただし不明な)入力を使用した場合よりも悪くありません。最も高く評価されている数値的手法には、数値の安定した分析が伴いますが、要求に応じていわゆる逆方向エラーを報告する実装はほとんど見つかりません。

(ii)漸近誤差推定。これらは、すべてのエラー(入力エラー、丸めエラーまたは離散化エラーが最も一般的な原因である)の生成物を無視できると仮定し(関数が非常に非線形の場合は疑わしい)、感度分析を使用して入力エラーを伝播します。数値安定性解析とともに、これは丸め誤差または離散化誤差の影響も捕捉できます。結果のエラーバーは、それらが基づいている仮定の妥当性と同様に実現可能です。自動微分ツールを使用すると、誤差推定のコストは通常​​、近似のコストに加えて1または2の係数になります。したがって、この種のエラー推定は実際にはかなり頻繁に行われます。

[編集]たとえば、Oettli-Pragerの定理は、線形システムの解に対して簡単に計算可能な逆方向誤差推定を提供します。感度分析は、これらの誤差に逆行列のノルムを掛ける必要があることを示しています。これは、Hagerの推定器(最新の条件数推定器に組み込まれている)を使用して推定できます。

(iii)確率的エラー分析:(CESTAC、http://www.sciencedirect.com/science/article/pii/0378475488900705)これは、3つの引数セットを評価する対応する確率的バリアントですべての操作をオーバーロードし、その後、人為的なランダム丸め誤差を追加することによって行われます。最後の3つの結果は、平方根の平均と標準偏差(平均からの偏差の2乗の合計を2 = 3-1で割った値)を計算するために使用されます。これにより、丸め誤差部分のかなり有用な精度の推定値が得られます。ただし、これは、一般にODEおよびPDE計算の支配的なエラーである離散化エラーを考慮していません。オーバーロードされた操作を実行する際のオーバーヘッドのため、コストはプログラミング言語に依存します。過負荷が時間のペナルティをもたらさないと仮定すると(これはほとんどありません)、結果とエラー推定のコストは、近似のみの計算と比較して3倍です。

(iv)間隔分析:これは、適切に行われた場合、すべてのエラーソースに対して厳密な境界を提供しますが、単純な場合を除き、境界が真のエラーを大幅に過大評価しないように多くの経験(またはそれを具体化するソフトウェア)が必要です。線形代数(たとえば、IntLab http://www.ti3.tu-harburg.de/rump/intlab/、次元が大きい場合は約6倍のコスト)およびグローバル最適化(たとえば、 、ココナッツhttp://www.mat.univie.ac.at/~coconut/coconut-environment/; 問題の特徴に応じて、近似的なグローバル最適化よりもはるかに高価であるか、さらに安価である可能性があります)。しかし、他の多くのクラスの問題を正確におよそ処理するのは簡単です(たとえば、太陽系の大きな惑星の軌道を10年以上にわたって囲むこと)。


ありがとう。(ii)職場で見たい。著者が感度解析と数値安定性解析を組み合わせて、グローバルな誤差推定値を決定する例を挙げてください。
highsciguy

@highsciguy:(ii)の編集を参照してください
アーノルドノイマイアー

ありがとう。ヤコビ行列逆ですか?
highsciguy

@highsciguy:最後の質問を理解しないでください。この例は、ヤコビアン図ではなく、線形方程式を解くことでした。
アーノルドノイマイアー

1
私は線形を見落としていました。それからそれは明らかです。Oettli-Pragerの定理を非線形システムに一般化する試みはありますか?
highsciguy

13

並べ替え。通常、過大評価である数値分析者によって導き出された理論上の誤差範囲があり、実際の問題では入手が困難な情報が含まれている可能性があるため、実際にはあまり有用ではありません。良い例は、常用方程式の解法における数値誤差の限界です。これは、HairerとWannerの本で見つけることができます。Nick Highamの著書、「数値アルゴリズムの精度と安定性」(タイトルについては少し外れているかもしれません)にも、一般的な数値演算と線形代数アルゴリズムに関するいくつかのエラー限界があります。数値解析の文献には、このような限界がたくさんあります。

間隔分析法は、誤差範囲の計算にも使用されています。これらの方法は厳密であり、理論的な誤差範囲よりも強い誤差範囲を提供する傾向がありますが、これらの方法は数値計算の誤差を大きく過大評価する可能性があります。これらの方法は、(私の知る限りでは)グローバル最適化で最大限に活用されていますが、不確実性の定量化でも使用されています。アーノルド・ノイマイアーは、区間分析法に関する本を少なくとも1冊執筆しており、このトピックについて詳しくコメントする資格があります。潜在的な過大評価の問題に加えて、区間解析方法は、既存の大規模な数値シミュレーションパッケージ(PETSc、Trilinos、CLAWPACK / PyClawなど)の改造を必要とする追加の計算インフラストラクチャを必要とします。)区間演算と自動微分を含める(テイラーベースの方法の場合)。私が見たものから、いくつかはありますが、許可された間隔計算と自動微分パッケージはあまりありません。それでも、これらのライブラリの機能が制限される場合があります。BLASのような機能を備えた許容ライセンス(LGPL、またはBSDのような)区間演算ライブラリを見つけるのは困難でした。

事後誤差の推定値はより簡単に取得できますが、厳密ではありません。私は常微分方程式の研究からこれらの推定値に最も精通していますが、偏微分方程式の解を計算するために使用される多くの方法にも存在します。

より一般的には、多項式カオス展開、モンテカルロ法、または他のサンプリング法の使用など、不確実性の定量化からの方法を使用して、入力パラメーターの変動による計算の不確実性を定量化できます。これらのメソッドは、パラメーターの変動に起因する何らかのヒューリスティックな「エラーバー」を提供できる必要がありますが、厳密な境界を与えることはありません。

数値誤差の指定に関しては、あなたは絶対に正しいと思います。計算科学は、実験ベースの物理科学と同じように、その結​​果を提示することに関して厳密でなければなりません。この分野で多くの作業が行われ(「不確実性の定量化」および「数値解析」という包括的用語で)、将来のある時点でほとんどの計算結果を議論する際にエラーバーが含まれることが期待されます。 。


これらの多項式カオス展開に関する概要記事の参考文献はありますか?用語が定期的に表示されるのを見てきましたが、それらについてもう少し学びたいと思います。ありがとう。
GertVdE

2
Dongbin Xiuは一般に、多項式カオス展開に関するアクセシブルな論文を書いています。ここで彼は書かれているより一般的な概要の論文の一つだ:dam.brown.edu/scicomp/media/report_files/BrownSC-2003-07.pdf
ジェフOxberry

7

他の回答に加えて、考慮すべき追加のポイントがいくつかあります。

  1. 数値的な離散化エラー、または少なくともスキームの順序は、分析的に決定できます。これらのエラーの説明は、一般に知られているスキームを使用している場合、論文から省略できます。
  2. 同じ問題(通常は単純なもの)が次第に細かいグリッドで実行されるグリッドの洗練の研究。これらは、L-ノルム(通常はL2)を見つけるために、正確な解、またはとんでもなく細かいグリッド上の解と比較されます。この誤差推定の勾配は、精度の次数を示します。
  3. 異なる数値スキームが利用可能であるが、グリッドの精密化または正確な解が利用できない問題では、Richardson Extrapolationと呼ばれる別の方法が誤差項に限界を与えます。これらの方法を説明する優れたレビューは、このペーパーで見つけることができます
  4. 最後に、各ジャーナルは受け入れのための独自の基準を設定します。厳しいものもあれば、そうでないものもあります。たとえば、AIAAはここで標準を設定しまし。他のジャーナルには著者向けの同様の情報があります。

ポイント2についてコメントしたいだけです。現実世界の問題を数値的に解決する場合、「途方もなく細かいグリッド」ではなく、2つの連続した改良の違いを比較する規範を見る可能性がはるかに高いと感じます。非常に細かいグリッドを解くことができる場合、なぜもっと粗いグリッドに煩わされるのですか?
ゴドリックシーア

グリッドの詳細化の研究は、通常、実際の問題に対しては実用的ではありません。これがポイント3の出番です。グリッドを徐々に改良するよりも、スキームの順序を変更することでエラーの範囲を決定するのがはるかに簡単です。たとえば、まだ非線形である非粘性渦を使用してコードを検証しますが、非常に細かい「正確な」ソリューションを実行して精度を検証できます。しかし、フルスワール燃焼器では、実際にそれを行うことができないため、異なるスキームを使用します。
tpg2114

また、グリッドを改良し、答えの違いを確認すると、グリッドの独立性が示されることに注意してください。これは、エラー境界の確認とは異なります。Large Eddy Simulationsのようなもののグリッドの改良は、他のワームの缶全体を開きますが、グリッドの改良は実際の場合でも必要です。
tpg2114

ありがとう、私は誤ってグリッドの独立性をエラー境界に関連付けていました。グリッドの独立性は、離散化エラーの質的な保証を意味すると常に考えていたと思います。
ゴドリックシーア

3
グリッドの独立性は、グリッドを細かくしても回答が改善されないことを意味しますが、回答の正確さや、グリッドをどの程度迅速に改善して精度が改善されたかはわかりません。
tpg2114
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.