HPCのローカルメモリ/計算、ネットワーク遅延、および帯域幅ジッターの統計モデル


11

並列計算は、確定的なローカル計算速度、レイテンシオーバーヘッド、およびネットワーク帯域幅を使用して頻繁にモデル化されます。実際には、これらは空間的に可変であり、非決定的です。Skinner and Kramer(2005)などの研究ではマルチモーダル分布が観察されていますが、パフォーマンス分析では常に決定論的分布またはガウス分布のいずれかが使用されているようです(不正確なだけでなく、負のレイテンシの正の確率により一貫性がありません)。

より忠実な統計モデルが開発されましたか?ローカルコンピューティング/メモリ、レイテンシ、および帯域幅の変動における相互相関の説明はありますか?


こんにちはジェッド、私はリトルの法則がよく使われることだけを知っています。
vanCompute

回答:


3

コンピューターサイエンスの観点から、メモリアクセス時間(レイテンシ)とメモリ帯域幅の一般的な統計モデルを作成することは理にかなっていないと思います。

アルゴリズムの統計モデルを作成することは理にかなっています。これは、各アルゴリズムには特定のメモリアクセスパターンがあるため、メモリアクセスパターンはキャッシュ階層に関連しているためです。たとえば、データの局所性が高いアルゴリズムは、他のアルゴリズムが必要とする非常に高速なメモリアクセス時間の恩恵を受ける低レベルキャッシュを活用しますRAM(または最悪の場合はスワップメモリ​​)に到達し、アクセス時間が極端に遅くなります。

汎用値はアーキテクチャの観点から与えられている、あなたはあなたのアーキテクチャを確認し、特定のメモリ位置(LETの言うL3キャッシュ)に与えられたコアからのアクセス時間を検索することができます。最近のアーキテクチャは、Non Uniform Memory Access NUMAであるため、作業が少し難しくなります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.