不連続なガラーキンは、連続的なガラーキンよりも並列化が可能ですか？

9

簡単な並列化がDGメソッドの利点の1つであるといつも聞いていましたが、これらの理由のいずれかが連続Galerkinにも当てはまらない理由がよくわかりません。

finite-element parallel-computing discontinuous-galerkin

1

私はそうは思いませんが、あなたがそれらの想定された理由のいくつかにリンクしたり、説明したりすると、質問を強化するかもしれません。

— Bill Barth

9

DGメソッドが並列メソッドとしてより注目される理由の1つは、メソッドが本質的に要素に対してローカルであることがすぐにわかることです。DGメソッドの結合は、隣接するエッジ（または3Dの面）を介してのみ発生するため、弱いものです。したがって、三角形または四角形の場合、DGはそれぞれ最大で3つまたは4つのプロセッサと通信します。CGメソッドには要素のコーナーが含まれますが、要素のコーナーの価数が重要になります。使用するメッシュジェネレーターに応じて、この価数は8つのプロセッサー（おそらくそれ以上）になります。したがって、時間微分をアセンブルするコストは、CGメソッドの場合は「より高い」と見なすことができます。これは特に、通信する情報の量が非常に大きくなる可能性がある（そして各パーティションのサイズが小さくなると、待ち時間の隠蔽がより困難になる可能性がある）スペクトル方式の場合に問題になります。

しかし、CGが時間微分を組み立てるためのこの追加コストは、別のロードバランシング戦略で補うことができます。異なるメッシュ分割戦略（私はMETISで最も農家です）により、ユーザーはさまざまなメトリックを通じて負荷のバランスをとることができます。たとえば、各パーティションにほぼ同じ数の要素があることを確認したり、パーティション間の通信量を制限したりできます。DGのコロシアムが容易に並列化できる理由は、問題を単純な部分に単純に分割すると、非常に効率的な並列実装が可能になり、キャッシュの影響により特定の場合に超線形速度が向上するためです（たとえば、Baggagなどを参照）。。またはアルトマンら。）。一方、CGではより賢いパーティション分割方法が必要になる場合があります。したがって、たとえば、空間離散化をDGからCGに変更するには、メッシュをサブ問題に分割する方法も再検討する必要があります。

— アンドリューウィンターズ
ソース

8

私が長年FEMソフトウェアを作成してきたことから、CGスキームよりもDGスキームの方が並列化に適しているという発言は奇抜であると思います。これは、DG論文の紹介でDGメソッドの正当化として頻繁に使用されますが、実際に質問を調査した参考文献で実証されたことはありません。これは、「暗号化」をより広範な影響のある領域として参照する数論プロジェクトに関するすべてのNSF提案に類似しています。この一般論では、これも実証されていません。

実際、私は、明示的な時間ステップスキームと、場合によっては、質量行列を反転する必要がある問題を除いて、DGスキームは、いずれかに関連する通信のコストを調査した場合、CGスキームより良くも悪くもないと考えています。これは実際的な意味での意味です。確かに、通信するデータが少なくて済むかもしれませんが、壁時計の時間の違いは、このデータに対して実行する他のすべての操作プログラムでは無視できると思います。

もちろん、私が間違っていることを証明するために誰かが挑戦してくれたら嬉しいです！

— ヴォルフガングバンガース
ソース

5

数値スキームについての最も一般的なステートメントの場合と同様に、答えは見ている状況によって異なります。まず第一に、並列化に関するDGの利点は、主に明示的な時間統合スキームの場合に利益をもたらします。

DGスキームのセルローカルな質量行列（質量行列の逆をグローバルに適用する必要がないため）
特により高次の場合の、CPUローカル作業（ボリューム積分）と通信関連作業（エッジ積分）の好ましい比率

これらのステートメントは一般的なDG離散化に適用されますが、実際の HPCアプリケーション（たとえば、数千のプロセッサーを使用）は、適切なスケーリングを維持するために、並列化戦略に関してさらに努力が必要です。たとえば、このペーパーでは、プロセッサごとに1セルまでのほぼ完全なスケーリングを実現する方法を示しています。これは確かに継続的なFEMからは期待できないものですが、前述のように、暗黙的なスキームはまったく異なります。

— 大きな
ソース

1

剛性マトリックスを組み立てるとき、連続（節点）FEMの要素に保存されたデータは、そのすべての節点近傍に伝達される必要があります。対照的に、DGFEMでは、要素データをその隣接するすべての要素に伝達する必要があります。1Dの節点と面の隣接は同じですが、3Dでは差が非常に大きくなる可能性があります。通常の六面体メッシュの場合、26の節点の隣接がありますが、面の隣接は6つだけです。原子価の高い頂点が多数ある不規則なメッシュの場合、CGの状況は悪化しますが、DGの状況は変わりません。

— Gokturk
ソース

本当ですが、あなたが実際に懸念していることは何ですか？言い換えれば、実際のFEMプログラムでこれらの要素を通信する時間を測定し、それを行列のエントリを計算するのに必要な時間と比較した場合、それは重要でしょうか？

— Wolfgang Bangerth 2014年

1

双曲線PDEのDGは、有限体積スキームの代わりとして使用できます。有限差分のように有限ボリュームでは、スキームの次数を増やすと、ステンシルが増加します。スキームの順序ごとにステンシルが異なるため、これにより並列化がより困難になります。パーティション境界では、スキームの特定の順序で隣接パーティションから必要なすべてのセルが利用可能であることを確認する必要があります。しかし、DGを使用すると、スキームの順序に関係なく、各セルは顔の隣人とのみ通信します。したがって、有限体積/差分とDGを比較すると、DGの方が並列化が容易であると言えます。

— cfdlab
ソース