私は多かれ少なかれこのようないくつかのコードを持っています:
#include <bitset>
enum Flags { A = 1, B = 2, C = 3, D = 5,
E = 8, F = 13, G = 21, H,
I, J, K, L, M, N, O };
void apply_known_mask(std::bitset<64> &bits) {
const Flags important_bits[] = { B, D, E, H, K, M, L, O };
std::remove_reference<decltype(bits)>::type mask{};
for (const auto& bit : important_bits) {
mask.set(bit);
}
bits &= mask;
}
Clang> = 3.6は賢いことを行い、これを単一のand
命令にコンパイルします(その後、他のすべての場所にインライン化されます)。
apply_known_mask(std::bitset<64ul>&): # @apply_known_mask(std::bitset<64ul>&)
and qword ptr [rdi], 775946532
ret
しかし、私が試したGCCのすべてのバージョンは、これを静的にDCEする必要があるエラー処理を含む巨大な混乱にコンパイルします。他のコードでは、important_bits
同等のコードをデータとして配置します!
.LC0:
.string "bitset::set"
.LC1:
.string "%s: __position (which is %zu) >= _Nb (which is %zu)"
apply_known_mask(std::bitset<64ul>&):
sub rsp, 40
xor esi, esi
mov ecx, 2
movabs rax, 21474836482
mov QWORD PTR [rsp], rax
mov r8d, 1
movabs rax, 94489280520
mov QWORD PTR [rsp+8], rax
movabs rax, 115964117017
mov QWORD PTR [rsp+16], rax
movabs rax, 124554051610
mov QWORD PTR [rsp+24], rax
mov rax, rsp
jmp .L2
.L3:
mov edx, DWORD PTR [rax]
mov rcx, rdx
cmp edx, 63
ja .L7
.L2:
mov rdx, r8
add rax, 4
sal rdx, cl
lea rcx, [rsp+32]
or rsi, rdx
cmp rax, rcx
jne .L3
and QWORD PTR [rdi], rsi
add rsp, 40
ret
.L7:
mov ecx, 64
mov esi, OFFSET FLAT:.LC0
mov edi, OFFSET FLAT:.LC1
xor eax, eax
call std::__throw_out_of_range_fmt(char const*, ...)
両方のコンパイラが正しいことをできるようにするには、このコードをどのように記述すればよいですか?それが失敗した場合、これを明確にして高速で保守可能な状態に保つには、どのようにこれを書けばよいですか?
(1ULL << B) | ... | (1ULL << O)
(1ULL << Constant)
| 行ごとに、定数名を別の行に配置すると、見やすくなります。
int
ビット演算の結果ができるint
ORすることができる long long
値に応じて、正式にenum
はint
定数と同等ではありません。clangは「あたかも」を要求し、gccは独断のままです
B | D | E | ... | O
か?