これは、最新のプロセッサの機能の組み合わせによるものです。
高IPSに貢献する最初のことは、最新のプロセッサが独立して動作できる複数の実行ユニットを持っているという事実です。下の画像(Wikipedia:Intel Core Microarchitectureから借用)では、すべての命令を同時に実行できる8つの実行ユニット(黄色で表示)があることがわかります。これらのユニットのすべてが同じタイプの命令を保護できるわけではありませんが、少なくとも5つのユニットがALU操作を実行でき、3つのSSE対応ユニットがあります。
それを、それらのユニットが命令を実行する準備ができている(必要に応じて順不同)命令を効率的にスタックできる長い命令パイプラインと組み合わせると、現代のプロセッサはいつでも多数の命令をオンザフライで実行できます。
各命令の実行には数クロックサイクルかかる場合がありますが、実行を効果的に並列化できる場合は、プロセッサの複雑さと熱出力を犠牲にして、IPSを大幅に向上させることができます。
これらの大きなパイプラインを命令で満たすには、命令とデータを事前に入力できる大きなキャッシュも必要です。これは、ダイのサイズと、プロセッサが生成する熱量の一因となります。
これがより小さなプロセッサで行われない理由は、処理コアの周りに必要な制御ロジックの量、必要なスペースの量、および発生する熱が大幅に増加するためです。小さくて低電力で応答性の高いプロセッサが必要な場合は、実際の機能コアを取り囲む「余分な」ものがあまりない短いパイプラインが必要です。そのため、通常はキャッシュを最小化し、命令の処理に必要な各タイプのユニットの1つのみに制限し、すべての部分の複雑さを軽減します。
彼らは可能性があり、より大きなプロセッサのような複雑なような小さなプロセッサを作り、同様の性能を達成したが、その後電源が描くと要件を冷却指数関数的に増加することになります。