タイトルは、ソートされていない配列よりもソートされた配列を処理する方が速いのはなぜですか?
これも分岐予測効果ですか?注意:ここでは、ソートされた配列の処理が遅くなります!!
次のコードについて考えてみます。
private static final int LIST_LENGTH = 1000 * 1000;
private static final long SLOW_ITERATION_MILLIS = 1000L * 10L;
@Test
public void testBinarySearch() {
Random r = new Random(0);
List<Double> list = new ArrayList<>(LIST_LENGTH);
for (int i = 0; i < LIST_LENGTH; i++) {
list.add(r.nextDouble());
}
//Collections.sort(list);
// remove possible artifacts due to the sorting call
// and rebuild the list from scratch:
list = new ArrayList<>(list);
int nIterations = 0;
long startTime = System.currentTimeMillis();
do {
int index = r.nextInt(LIST_LENGTH);
assertEquals(index, list.indexOf(list.get(index)));
nIterations++;
} while (System.currentTimeMillis() < startTime + SLOW_ITERATION_MILLIS);
long duration = System.currentTimeMillis() - startTime;
double slowFindsPerSec = (double) nIterations / duration * 1000;
System.out.println(slowFindsPerSec);
...
}
これにより、私のマシンで約720の値が出力されます。
コレクションの並べ替え呼び出しをアクティブにすると、その値は142に下がります。なぜですか?!?
結果は決定的なものであり、反復回数/時間を増やしても変化しません。
Javaバージョンは1.8.0_71(Oracle VM、64ビット)で、Windows 10、EclipseMarsのJUnitテストで実行されます。
更新
連続したメモリアクセスに関連しているようです(ダブルオブジェクトは順番にアクセスされるのか、ランダムにアクセスされるのか)。配列の長さが約10k以下の場合、効果は消え始めます。
/**
* Benchmark Mode Cnt Score Error Units
* SO35018999.shuffled avgt 10 8.895 ± 1.534 ms/op
* SO35018999.sorted avgt 10 8.093 ± 3.093 ms/op
* SO35018999.sorted_contiguous avgt 10 1.665 ± 0.397 ms/op
* SO35018999.unsorted avgt 10 2.700 ± 0.302 ms/op
*/