Cでビッグエンディアンをリトルエンディアンに変換する関数を記述する必要があります。ライブラリ関数を使用できません。
Cでビッグエンディアンをリトルエンディアンに変換する関数を記述する必要があります。ライブラリ関数を使用できません。
回答:
必要なものが単純なバイトスワップであると仮定して、次のようなことを試してください
符号なし16ビット変換:
swapped = (num>>8) | (num<<8);
符号なし32ビット変換:
swapped = ((num>>24)&0xff) | // move byte 3 to byte 0
((num<<8)&0xff0000) | // move byte 1 to byte 2
((num>>8)&0xff00) | // move byte 2 to byte 1
((num<<24)&0xff000000); // byte 0 to byte 3
これにより、バイト順序が1234から4321にスワップされます。入力がの0xdeadbeef
場合、32ビットのエンディアンスワップの出力はになる可能性があります0xefbeadde
。
上記のコードは、マジックナンバーの代わりにマクロまたは少なくとも定数を使用してクリーンアップする必要がありますが、うまくいけばそのまま
編集:別の答えが指摘したように、プラットフォーム、OS、および命令セット固有の代替手段があり、上記よりもはるかに高速です。Linuxカーネルには、エンディアンを適切に処理するマクロ(cpu_to_be32など)があります。しかし、これらの選択肢は環境に固有です。実際には、エンディアンは、利用可能なアプローチを組み合わせて使用するのが最も効果的です。
((num & 0xff) >> 8) | (num << 8)
場合、gcc 4.8.3は単一のrol
命令を生成します。また、32ビット変換がとして記述されている((num & 0xff000000) >> 24) | ((num & 0x00ff0000) >> 8) | ((num & 0x0000ff00) << 8) | (num << 24)
場合、同じコンパイラが単一のbswap
命令を生成します。
struct byte_t reverse(struct byte_t b) { struct byte_t rev; rev.ba = b.bh; rev.bb = b.bg; rev.bc = b.bf; rev.bd = b.be; rev.be = b.bd; rev.bf = b.bc; rev.bg = b.bb; rev.bh = b.ba; return rev;}
。しかし、それが他の提案と同じくらい速いかどうかはわかりません。intの場合は、union { int i; byte_t[sizeof(int)]; }
を使用して整数をバイト単位で逆にします。
含めることにより:
#include <byteswap.h>
マシンに依存するバイトスワップ関数の最適化されたバージョンを取得できます。その後、次の関数を簡単に使用できます。
__bswap_32 (uint32_t input)
または
__bswap_16 (uint16_t input)
#include <byteswap.h>
あります。.hファイル自体のコメントを参照してください。この投稿には役立つ情報が含まれているため、著者がlib関数を使用しないというOP要件を無視しているにもかかわらず、私は賛成票を投じました。
#include <stdint.h>
//! Byte swap unsigned short
uint16_t swap_uint16( uint16_t val )
{
return (val << 8) | (val >> 8 );
}
//! Byte swap short
int16_t swap_int16( int16_t val )
{
return (val << 8) | ((val >> 8) & 0xFF);
}
//! Byte swap unsigned int
uint32_t swap_uint32( uint32_t val )
{
val = ((val << 8) & 0xFF00FF00 ) | ((val >> 8) & 0xFF00FF );
return (val << 16) | (val >> 16);
}
//! Byte swap int
int32_t swap_int32( int32_t val )
{
val = ((val << 8) & 0xFF00FF00) | ((val >> 8) & 0xFF00FF );
return (val << 16) | ((val >> 16) & 0xFFFF);
}
更新:64ビットバイトスワッピングを追加
int64_t swap_int64( int64_t val )
{
val = ((val << 8) & 0xFF00FF00FF00FF00ULL ) | ((val >> 8) & 0x00FF00FF00FF00FFULL );
val = ((val << 16) & 0xFFFF0000FFFF0000ULL ) | ((val >> 16) & 0x0000FFFF0000FFFFULL );
return (val << 32) | ((val >> 32) & 0xFFFFFFFFULL);
}
uint64_t swap_uint64( uint64_t val )
{
val = ((val << 8) & 0xFF00FF00FF00FF00ULL ) | ((val >> 8) & 0x00FF00FF00FF00FFULL );
val = ((val << 16) & 0xFFFF0000FFFF0000ULL ) | ((val >> 16) & 0x0000FFFF0000FFFFULL );
return (val << 32) | (val >> 32);
}
int32_t
とint64_t
変種のマスキングの背後にある理由何である... & 0xFFFF
とは... & 0xFFFFFFFFULL
?私が見ないここで符号拡張で何かが起こっていますか?また、なぜswap_int64
戻ってくるのuint64_t
ですか?そうじゃないのint64_t
?
swap_int64
返答の戻り値の型を変更したい場合があります。参考までに+ 1、BTW!
LL
は不要であるの(u)swap_uint64()
と同様に、L
は不要です(u)swap_uint32()
。U
で必要とされないuswap_uint64()
ようなあまりU
に必要とされていませんuswap_uint32()
これはかなり一般的なバージョンです。私はそれをコンパイルしていないので、おそらくタイプミスがあるでしょうが、あなたは考えを理解するべきです、
void SwapBytes(void *pv, size_t n)
{
assert(n > 0);
char *p = pv;
size_t lo, hi;
for(lo=0, hi=n-1; hi>lo; lo++, hi--)
{
char tmp=p[lo];
p[lo] = p[hi];
p[hi] = tmp;
}
}
#define SWAP(x) SwapBytes(&x, sizeof(x));
注意:これは速度やスペースに最適化されていません。明確で(デバッグが容易)、移植可能であることを目的としています。
2018-04-04を更新 コメント(@chux)で発見された、n == 0の無効なケースをトラップするassert()を追加しました。
bswap
、最適化を有効にした適切なX86コンパイラーによって単一の命令にコンパイルされます。サイズのパラメーターを持つこのバージョンはそれを行うことができませんでした。
マクロ(組み込みシステムなど)が必要な場合:
#define SWAP_UINT16(x) (((x) >> 8) | ((x) << 8))
#define SWAP_UINT32(x) (((x) >> 24) | (((x) & 0x00FF0000) >> 8) | (((x) & 0x0000FF00) << 8) | ((x) << 24))
UINT
が彼らの名前にあるのです。
編集:これらはライブラリ関数です。それらに従うことはそれを行うための手動の方法です。
__byteswap_ushort、__ byteswap_ulong、および__byteswap_uint64を知らない人の数に私はまったく驚かされます。もちろん、それらはVisual C ++固有のものですが、x86 / IA-64アーキテクチャーでは美味しいコードにコンパイルされます。:)
このページから取得した、bswap
命令の明示的な使用方法を次に示します。上記の組み込みフォームは常に thisよりも高速になることに注意してください。ライブラリルーチンなしで答えを出すためだけに追加しました。
uint32 cq_ntohl(uint32 a) {
__asm{
mov eax, a;
bswap eax;
}
}
冗談として:
#include <stdio.h>
int main (int argc, char *argv[])
{
size_t sizeofInt = sizeof (int);
int i;
union
{
int x;
char c[sizeof (int)];
} original, swapped;
original.x = 0x12345678;
for (i = 0; i < sizeofInt; i++)
swapped.c[sizeofInt - i - 1] = original.c[i];
fprintf (stderr, "%x\n", swapped.x);
return 0;
}
int i, size_t sizeofInt
両方に同じタイプではなく、使用することに興味があります。
4 int
の倍数であると仮定して、Intel組み込み関数を使用してSSSE3命令pshufbを使用する方法を次に示します。
unsigned int *bswap(unsigned int *destination, unsigned int *source, int length) {
int i;
__m128i mask = _mm_set_epi8(12, 13, 14, 15, 8, 9, 10, 11, 4, 5, 6, 7, 0, 1, 2, 3);
for (i = 0; i < length; i += 4) {
_mm_storeu_si128((__m128i *)&destination[i],
_mm_shuffle_epi8(_mm_loadu_si128((__m128i *)&source[i]), mask));
}
return destination;
}
これは動作しますか/速くなりますか?
uint32_t swapped, result;
((byte*)&swapped)[0] = ((byte*)&result)[3];
((byte*)&swapped)[1] = ((byte*)&result)[2];
((byte*)&swapped)[2] = ((byte*)&result)[1];
((byte*)&swapped)[3] = ((byte*)&result)[0];
char
、ではありませんbyte
。
これが私が使用している関数です-テストされ、あらゆる基本的なデータ型で動作します:
// SwapBytes.h
//
// Function to perform in-place endian conversion of basic types
//
// Usage:
//
// double d;
// SwapBytes(&d, sizeof(d));
//
inline void SwapBytes(void *source, int size)
{
typedef unsigned char TwoBytes[2];
typedef unsigned char FourBytes[4];
typedef unsigned char EightBytes[8];
unsigned char temp;
if(size == 2)
{
TwoBytes *src = (TwoBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[1];
(*src)[1] = temp;
return;
}
if(size == 4)
{
FourBytes *src = (FourBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[3];
(*src)[3] = temp;
temp = (*src)[1];
(*src)[1] = (*src)[2];
(*src)[2] = temp;
return;
}
if(size == 8)
{
EightBytes *src = (EightBytes *)source;
temp = (*src)[0];
(*src)[0] = (*src)[7];
(*src)[7] = temp;
temp = (*src)[1];
(*src)[1] = (*src)[6];
(*src)[6] = temp;
temp = (*src)[2];
(*src)[2] = (*src)[5];
(*src)[5] = temp;
temp = (*src)[3];
(*src)[3] = (*src)[4];
(*src)[4] = temp;
return;
}
}
source
います。必要に応じて調整されますが、その仮定が満たされない場合、コードはUBです。
編集:この関数は、整列された16ビットワードのエンディアンのみを交換します。UTF-16 / UCS-2エンコーディングによく必要な関数。編集終了。
メモリブロックのエンディアンを変更する場合は、私の非常に高速なアプローチを使用できます。メモリアレイのサイズは8の倍数にする必要があります。
#include <stddef.h>
#include <limits.h>
#include <stdint.h>
void ChangeMemEndianness(uint64_t *mem, size_t size)
{
uint64_t m1 = 0xFF00FF00FF00FF00ULL, m2 = m1 >> CHAR_BIT;
size = (size + (sizeof (uint64_t) - 1)) / sizeof (uint64_t);
for(; size; size--, mem++)
*mem = ((*mem & m1) >> CHAR_BIT) | ((*mem & m2) << CHAR_BIT);
}
この種の関数は、Unicode UCS-2 / UTF-16ファイルのエンディアンを変更するのに役立ちます。
t know if it
は提案ほど速くありませんが、それはうまくいきません:github.com/heatblazer/helpers/blob/master/utils.h
CHAR_BIT
代わりの8
よう好奇心旺盛である0xFF00FF00FF00FF00ULL
に依存していますCHAR_BIT == 8
。LL
定数では必要ないことに注意してください。
CHAR_BIT
そのマクロの露出を増やすためにのみ書いた。LLに関しては、何よりもアノテーションです。また、バグのあるコンパイラー(標準に準拠していないもの)を使用して、昔から気付いていた習慣も正しくありませんでした。
このコードスニペットは、32ビットのリトルエンディアン数をビッグエンディアン数に変換できます。
#include <stdio.h>
main(){
unsigned int i = 0xfafbfcfd;
unsigned int j;
j= ((i&0xff000000)>>24)| ((i&0xff0000)>>8) | ((i&0xff00)<<8) | ((i&0xff)<<24);
printf("unsigned int j = %x\n ", j);
}
x86またはx86_64プロセッサで実行している場合、ビッグエンディアンはネイティブです。そう
16ビット値の場合
unsigned short wBigE = value;
unsigned short wLittleE = ((wBigE & 0xFF) << 8) | (wBigE >> 8);
32ビット値の場合
unsigned int iBigE = value;
unsigned int iLittleE = ((iBigE & 0xFF) << 24)
| ((iBigE & 0xFF00) << 8)
| ((iBigE >> 8) & 0xFF00)
| (iBigE >> 24);
コンパイラがこれがバイトレベルの操作であることを認識し、バイトスワップコードを生成しない限り、これは最も効率的なソリューションではありません。しかし、それはメモリレイアウトのトリックに依存せず、かなり簡単にマクロに変えることができます。