1.3 GHz ARM Cortex-A53を使用しているタブレットでAndroidベンチマークを実行すると、64ビットコンパイルと32ビットコンパイルのパフォーマンスが大幅に向上することがわかりました。最新のものはEclipseを介してコンパイルされ、実行時にCPUがARM、Intel、MIPSのいずれであるかを検出し、次に32ビットまたは64ビットのアーキテクチャーを検出します。
Intel CPU用の以前のWindowsコンパイルでは、SSEタイプのSIMD命令を使用するため、64ビットの動作は32ビットよりもはるかに高速でした。ただし、下位互換性のない最新の32ビットコンパイラでは、実質的に同じコードと同様の速度が得られます。
Androidベンチマークの詳細を以下に示します。A53から、および1.2 GHz Cortex-A9を介して32ビットおよび64ビットの結果を示しています。最後に、使用されているさまざまな命令を識別するアセンブリコードのリストがあります。以下は結果の要約です。
http://www.roylongbottom.org.uk/android%2064%20bit%20benchmarks.htm#anchorStart
Whetstone Benchmark-(小さなループ)同様のパフォーマンス。全体的な評価はEXP関数を使用したテストのコンパイルによって影響を受けます。
Dhrystoneベンチマーク-最新のMIPS / MHz 1.09 32ビット、1.96 64ビット、1.10 A9-多分64ビットが最適化されています。
Linpackベンチマーク-(N = 100)64ビットDP 1.97 x高速、SP 2.67 x-アセンブリコードを参照してください。
Livermore Loops-(24カーネル)平均で1.5倍速く、範囲は0.8から7.9倍
L1 / L2キャッシュおよびRAMテスト
MemSpeed-浮動小数点と整数の計算-キャッシュ2.2 x、RAM 1.5 xを獲得。
BusSpeed-整数データストリーミングとバースト読み取り-ストリーミング2.0 x L1、1.5 x L2、1.25 x RAM-バースト2.6 x L1、同様のL2とRAM。
RandMem-同じ複雑なインデックス構造からのシリアルおよびランダムな読み取りと読み取り/書き込み-一般に、読み取りは少し高速ですが、読み取り/書き込みは類似/低速です。
次に、上記のMPバージョンがあり、4コア最大2.7 GFLOPS 32ビットおよび5.5 GFLOPS 64ビットで最大SP MFLOPS(MP-MFLOPS)を測定しようとします。64ビットコンパイラが32ビットで5.7に対して最大10.8 GFLOPSで代替命令を生成するNEON組み込みを使用するバージョンもあります-アセンブリリストを参照してください。Windows 10およびAndroid Intel Atomベースのタブレットのこれらのベンチマークのバージョンも持っています-64ビットおよび32ビットWindows、32ビットAndroid-フル64ビットは完全には実装されていません-64ビットLinuxカーネルですが32ビットAndroid。
http://www.roylongbottom.org.uk/android%20benchmarks.htm
さらに、32ビットと64ビットのLinux / Intelバージョンがあります。
ロイ・ロングボトム