コンパイラーは、これらを複数のレジスターに保管し、必要に応じて複数の命令を使用してそれらの値の演算を行います。ほとんどのISAには、x86のadc
ようなキャリー付き加算命令があり、拡張精度の整数加算/減算を行うのがかなり効率的です。
たとえば、
fn main() {
let a = 42u128;
let b = a + 1337;
}
コンパイラーは、最適化なしでx86-64向けにコンパイルすると、以下を生成します。
(@PeterCordesによって追加されたコメント)
playground::main:
sub rsp, 56
mov qword ptr [rsp + 32], 0
mov qword ptr [rsp + 24], 42 # store 128-bit 0:42 on the stack
# little-endian = low half at lower address
mov rax, qword ptr [rsp + 24]
mov rcx, qword ptr [rsp + 32] # reload it to registers
add rax, 1337 # add 1337 to the low half
adc rcx, 0 # propagate carry to the high half. 1337u128 >> 64 = 0
setb dl # save carry-out (setb is an alias for setc)
mov rsi, rax
test dl, 1 # check carry-out (to detect overflow)
mov qword ptr [rsp + 16], rax # store the low half result
mov qword ptr [rsp + 8], rsi # store another copy of the low half
mov qword ptr [rsp], rcx # store the high half
# These are temporary copies of the halves; probably the high half at lower address isn't intentional
jne .LBB8_2 # jump if 128-bit add overflowed (to another not-shown block of code after the ret, I think)
mov rax, qword ptr [rsp + 16]
mov qword ptr [rsp + 40], rax # copy low half to RSP+40
mov rcx, qword ptr [rsp]
mov qword ptr [rsp + 48], rcx # copy high half to RSP+48
# This is the actual b, in normal little-endian order, forming a u128 at RSP+40
add rsp, 56
ret # with retval in EAX/RAX = low half result
あなたは価値があることがわかりますどこ42
に保存されているrax
とrcx
。
(編集者注:x86-64 C呼び出し規約はRDX:RAXで128ビット整数を返します。ただし、これmain
は値をまったく返しません。冗長なコピーはすべて、純粋に最適化を無効にすることによるものであり、Rustはデバッグでオーバーフローを実際にチェックしますモード。)
比較のため、x86-64でのRust 64ビット整数のasmを以下に示します。キャリー付きのキャリーは必要ありません。値ごとに1つのレジスタまたはスタックスロットのみです。
playground::main:
sub rsp, 24
mov qword ptr [rsp + 8], 42 # store
mov rax, qword ptr [rsp + 8] # reload
add rax, 1337 # add
setb cl
test cl, 1 # check for carry-out (overflow)
mov qword ptr [rsp], rax # store the result
jne .LBB8_2 # branch on non-zero carry-out
mov rax, qword ptr [rsp] # reload the result
mov qword ptr [rsp + 16], rax # and copy it (to b)
add rsp, 24
ret
.LBB8_2:
call panic function because of integer overflow
setb / testはまだ完全に冗長です:jc
(CF = 1の場合はジャンプ)で問題なく動作します。
最適化を有効にすると、Rustコンパイラはオーバーフローをチェックしないため、のように+
機能し.wrapping_add()
ます。