10
コードのシリアルパフォーマンスを改善するための優れた戦略は何ですか?
私は計算科学に携わっており、その結果、多くのコードの科学的スループットを向上させ、これらのコードの効率を理解しようとするのに、かなりの時間を費やしています。 私が取り組んでいるソフトウェアのパフォーマンス対可読性/再利用性/保守性のトレードオフを評価したと仮定しましょう、そして私はパフォーマンスのために行く時だと決めました。また、(フロップ/秒とメモリ帯域幅に関して)私の問題に対してより良いアルゴリズムがないことを知っていると仮定しましょう。私のコードベースは、C、C ++、Fortranなどの低レベル言語であると仮定することもできます。最後に、コードに並列性がないこと、または単一コアでのパフォーマンスのみに関心があると仮定します。 最初に試すべき最も重要なことは何ですか?どれだけのパフォーマンスが得られるかを知るにはどうすればよいですか?
66
performance