gzip形式のファイル(gzipプログラムで作成されたファイルなど)は、「deflate」圧縮アルゴリズムを使用します。これは、zlibが使用するものと同じ圧縮アルゴリズムです。ただし、zlibを使用してgzip圧縮ファイルを拡張すると、ライブラリはを返しますZ_DATA_ERROR。
zlibを使用してgzipファイルを解凍するにはどうすればよいですか?
gzip形式のファイル(gzipプログラムで作成されたファイルなど)は、「deflate」圧縮アルゴリズムを使用します。これは、zlibが使用するものと同じ圧縮アルゴリズムです。ただし、zlibを使用してgzip圧縮ファイルを拡張すると、ライブラリはを返しますZ_DATA_ERROR。
zlibを使用してgzipファイルを解凍するにはどうすればよいですか?
回答:
zlibのではgzip形式のファイルを解凍するには、呼び出しinflateInit2でwindowBitsパラメータとして16+MAX_WBITS、このように、:
inflateInit2(&stream, 16+MAX_WBITS);
これを行わないと、zlibは不正なストリーム形式について文句を言うでしょう。デフォルトでは、zlibはzlibヘッダーを使用してストリームを作成します。指示がない限り、inflateは異なるgzipヘッダーを認識しません。これはzlib.hヘッダーファイルのバージョン1.2.1から文書化されていますが、zlibマニュアルには含まれていません。ヘッダーファイルから:
windowBitsオプションのgzipデコードでは、15より大きくすることもできます。32を追加するwindowBitsと、zlibとgzipのデコードが自動ヘッダー検出で有効になります。16を追加すると、gzip形式のみがデコードされます(zlib形式ではが返されますZ_DATA_ERROR)。gzipストリームがデコードされている場合strm->adlerは、adler32ではなくcrc32です。
python zlibモジュールもこれらをサポートします。
しかしzlib、それらすべてのフォーマットを解凍できます:
deflateフォーマットを(非)圧縮するには、wbits = -zlib.MAX_WBITSzlibフォーマットを(非)圧縮するには、wbits = zlib.MAX_WBITSgzipフォーマットを(非)圧縮するには、wbits = zlib.MAX_WBITS | 16でドキュメントを参照してくださいhttp://www.zlib.net/manual.html#Advanced(セクションinflateInit2)
テストデータ:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>>
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>
明白なテストzlib:
>>> zlib.decompress(zlib_data)
'test'
のテストdeflate:
>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
のテストgzip:
>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
データはgzipモジュールとも互換性があります:
>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
追加32するwindowBitsとヘッダー検出がトリガーされます
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
gzip代わりに使用gzipgzipヘッダとデータを使用できgzip、直接モジュールを。ただし、内部でgzipは、を使用していることを忘れないでくださいzlib。
fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
zlib.decompress(data, 15 + 32)