http://www.nersc.gov/users/computational-systems/edison/configurationで4時間、10万コアでスーパーコンピューター計算を実行し、ネットワーク上で約4 PBのデータを交換し、約4 TBのI / O. 計算はすべて整数であるため、結果は正しいか間違っています(中間の数値エラーはありません)。
コードが正しいと仮定して、ハードウェア障害のために計算が間違っている確率を推定したいと思います。これについて良い方法は何ですか?そのような推定を行うために必要な数値の良い情報源はありますか?