8 行列がキャッシュに収まらない場合の密な行列乗算の実装について読んでいます。私が見たグラフの1つ(これらのスライドのスライド9 )は、単純なアルゴリズムを使用した場合のパフォーマンスの急激な低下を示しています。この低下は速度の約50%であり、マトリックスがまだキャッシュに収まっている間に発生し、1つまたは2つのサイズでのみ発生します。素朴なアルゴリズムを使用するつもりはありませんが、突然のパフォーマンス低下の原因を知りたいのですが。(低下はブロックされたアルゴリズムでも発生しますが、はるかに小さいです。) linear-algebra matrix blas — cjordan1 ソース
6 これは、キャッシュ連想の典型的な例です。その問題のサイズに関連するストライドは、他のセットに多くのスペースがあるにもかかわらず、特定のセットをいっぱいにしてキャッシュを追い出していることです。 トピックに関するグスタボドゥアルテの優れたブログ投稿の図 Drepperのすべてのプログラマがメモリについて知っておくべきことも参照してください。 — ジェッド・ブラウン ソース