gzip形式のファイル(gzip
プログラムで作成されたファイルなど)は、「deflate」圧縮アルゴリズムを使用します。これは、zlibが使用するものと同じ圧縮アルゴリズムです。ただし、zlibを使用してgzip圧縮ファイルを拡張すると、ライブラリはを返しますZ_DATA_ERROR
。
zlibを使用してgzipファイルを解凍するにはどうすればよいですか?
gzip形式のファイル(gzip
プログラムで作成されたファイルなど)は、「deflate」圧縮アルゴリズムを使用します。これは、zlibが使用するものと同じ圧縮アルゴリズムです。ただし、zlibを使用してgzip圧縮ファイルを拡張すると、ライブラリはを返しますZ_DATA_ERROR
。
zlibを使用してgzipファイルを解凍するにはどうすればよいですか?
回答:
zlibのではgzip形式のファイルを解凍するには、呼び出しinflateInit2
でwindowBits
パラメータとして16+MAX_WBITS
、このように、:
inflateInit2(&stream, 16+MAX_WBITS);
これを行わないと、zlibは不正なストリーム形式について文句を言うでしょう。デフォルトでは、zlibはzlibヘッダーを使用してストリームを作成します。指示がない限り、inflateは異なるgzipヘッダーを認識しません。これはzlib.h
ヘッダーファイルのバージョン1.2.1から文書化されていますが、zlibマニュアルには含まれていません。ヘッダーファイルから:
windowBits
オプションのgzipデコードでは、15より大きくすることもできます。32を追加するwindowBits
と、zlibとgzipのデコードが自動ヘッダー検出で有効になります。16を追加すると、gzip形式のみがデコードされます(zlib形式ではが返されますZ_DATA_ERROR
)。gzipストリームがデコードされている場合strm->adler
は、adler32ではなくcrc32です。
python zlib
モジュールもこれらをサポートします。
しかしzlib
、それらすべてのフォーマットを解凍できます:
deflate
フォーマットを(非)圧縮するには、wbits = -zlib.MAX_WBITS
zlib
フォーマットを(非)圧縮するには、wbits = zlib.MAX_WBITS
gzip
フォーマットを(非)圧縮するには、wbits = zlib.MAX_WBITS | 16
でドキュメントを参照してくださいhttp://www.zlib.net/manual.html#Advanced(セクションinflateInit2
)
テストデータ:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>>
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>
明白なテストzlib
:
>>> zlib.decompress(zlib_data)
'test'
のテストdeflate
:
>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
のテストgzip
:
>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
データはgzip
モジュールとも互換性があります:
>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
追加32
するwindowBits
とヘッダー検出がトリガーされます
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
gzip
代わりに使用gzip
gzipヘッダとデータを使用できgzip
、直接モジュールを。ただし、内部でgzip
は、を使用していることを忘れないでくださいzlib
。
fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
zlib.decompress(data, 15 + 32)