デコードされたMP3からFLACがMP3よりも大きいのはなぜですか?


13

タイトルよりも正確に言うと、320 kbpsのMP3ファイルがあるとします。それを解凍すると、論理的には、オーディオの各秒のうち約320キロビットを除くすべてのデータは、圧縮して除去できる冗長データであるはずです。だから、解凍したファイルをFLACや他のロスレスコーデックにエンコードすると、なぜそんなに大きいのですか?

関連するノートでは、圧縮解除されたwavからソースmp3オーディオをロスレスで回復することは理論的に可能ですか?(mp3自体が損失があることは知っています。それ以上損失することなく再エンコードできるかどうかを尋ねています。)

編集:関連する質問とその背後にある理論的根拠を明確にします。私がMP3ファイルから解凍されたwavを持っていると仮定します(そして、私は何らかの理由でmp3自体を持っていないと仮定します)。これ以上品質を失いたくない場合は、FLACまたは他のロスレスエンコーダーで再エンコードし、同じ品質を維持するためだけに大きなファイルを取得できます。または、再びmp3にエンコードし直して元のサイズと同じサイズにすることもできますが、より多くのデータが失われます。明らかに、これらのケースはどちらも理想的ではありません。元のサイズまたは元の品質のいずれかを使用できますが、両方は使用できません(元のロスレスソースではなく、元のmp3の品質を意味します)。私の質問は、両方を入手できますか?損失のある非圧縮データから損失のある圧縮データをさらに失うことなく回復することは理論的に可能ですか?

可能であれば、FLACでオーディオを圧縮するロスレス圧縮アルゴリズムを想像できます。次に、以前の不可逆圧縮の兆候がないかオーディオをスキャンし、検出された場合、元の不可逆ファイルに可逆圧縮します。次に、小さい方のファイルが保持されます。


これがオーディオのリッピングとエンコードに関する私のお気に入りのガイドです。お楽しみください、それは素晴らしい読書です:mp3.radified.com

2
デコーダーは、無意味なビットで320 kbから1411 kbにパディングするだけではなく、PCMファイルのビットレートは、サンプルあたりのビット値、チャンネル数、およびサンプリングレートによって与えられます。標準のCDオーディオの場合、これは(2チャネル)*(44.1KHzサンプルレート)*(16ビット/サンプル)= 1411kbpsです。
スケリー

シンプル、MP3は圧縮、FLACは非圧縮です。変換すると、MP3データが圧縮解除されます。
モアブ

2
それは間違いです。FLACはオーディオ圧縮形式です。
ライアンC.トンプソン

回答:


31

FLACが同じデータのMP3よりも大きいのは、エンコードが異なるためです。:) MP3は知覚情報をエンコードするだけで、FLACはすべてのデータをコンパクトな形式で保存します。

  • WAVをFLACに変換することは、BMPをPNGに変換することに似ています。
    • 正確なピクセルは同じですが、ZIPファイルのように可逆的に圧縮して小さいサイズにします。
  • WAVをMP3に変換することは、BMPをJPEGに変換することに似ています。
    • 正確なピクセルを保存する代わりに、オリジナルのような色の波紋を持つ正方形を生成するための命令を実際に保存します。

同様に、MP3はリップルを生成するための命令を保存するだけで、それらを一緒に追加すると、オリジナルのようなサウンドになります。しかし、真の信号と生成された信号(エラー信号)の違いは、JPEGジャギーのようなランダムでノイズの多いアーティファクトで構成されています。これをFLACのような完璧主義的な形式で保存すると、これらすべてのジャギーを保存する必要があり、ランダムノイズは可逆的に圧縮するのが難しくなるため、ファイルのサイズが大きくなります。(完全にランダムなノイズは圧縮できません。ファイルを無損失で圧縮すると、冗長な繰り返しパターンがなくなり、ランダムノイズのように見えます。)

JPEGをPNGに変換すると、MP3をFLACに変換するときと同じサイズの増加が見られます。完璧主義のロスレスコーデックは、オリジナルのbmpにない小さなジャギーやアーティファクトをすべて記憶する必要があるためです。

オーディオは線画図よりも写真のようなものであるため、このアナロジーは完全ではありませんが、アイデアを理解するのに役立ちます。

元のBMPサイズ:29 kB

PNG形式の青い点

PNGサイズ:629 B

ジャギーのあるJPEG形式の青い点

JPEGサイズ:1.7 kB

PNGに再エンコードされたジャギーを含む青いドット

JPEGから作成されたPNG:6.2 kB


3
ただし、ファイルをJPGに変換すると、データは失われ、PNGに変換しても復元できません。FLAC / PNGにさらにデータがある場合、その多くは架空のものです。
パビウム2009年

1
はい。意味のあるデータが失われ、誤ったデータが作成されます。
endolith

1
これは、エンドリスのサンプル図に明確に示されています。
hplbsh 2009年

1
これは驚くほど徹底した答えです。良くやった!
カウゴッド

1
あなたが正しいです。私は何を考えていたのかわかりません。
ケビンパンコ

2

MP3をデコードすると、ビットレートに関係なく、標準の1411kbps / 44100Hz 16bit(またはソースが何であれ)PCMオーディオが得られます。エンコード/再エンコード、コーデックのファイルは、コンピューター、MP3プレーヤーなどで再生するときに圧縮解除されます。

FLACエンコーダーは、圧縮するオーディオがデコードされたMP3または新しいCDのどちらであるかを気にしません。オーディオデータを変更せずにソースファイルのサイズを単純に縮小し、ソースの完全な回復を可能にします。ロスレスプロセス。

MP3から作成されたFLACファイルはMP3とまったく同じように聞こえ、CDトラックから作成されたFLACファイルはCDとまったく同じように聞こえます。


0

あなたはその後、ロスレスエンコーダを選ぶ、MP3からWAVに戻って変換する場合、一部2に答えるために、あなたがすべき完了したら、同じ品質のファイルを持っています。

FLACがMP3よりも大きい理由については、圧縮率の高い形式の1つを使用して圧縮解除し、効率の低い圧縮ツールで再圧縮します(ただし、再生の品質は向上します)。

これは、JPGをPNGに変換する理由を尋ねるようなものです。ファイルを(部分的に)解凍してから、ロスレスで再圧縮します。FLACは、PNGと同様、スペースではなく品質のために最適化されています


FLAC(およびPNG)はロスレスなので、品質が最適化されていると言っても意味がありません。
ジョアキムエロフソン

3
@Joakim:ロスレス==最大品質。したがって、ロスレスフォーマットは定義により品質が最適化されます
いんちきのキホーテ

2
定義上、それが私のポイントなので、最適化はありません。defintionが最高品質である場合は、その後、最適化することは何もありません
ヨアキムElofsson

0

mp3はデコーダーを再生可能にする必要があり、デコーダーの結果は元のトラックの近似値(通常はCDから)であるため、デコーダーはデータを追加して再生可能にします(これはナンセンスデータではありません)。結果の近似は、元のトラックと同じビットレートになりました。mp3をデコードしないと、情報は意味をなさないので、他のものに変換することはできません(ステレオMP3から2XモノMP3などの非常に類似したエンコードでない限り)。また、FLACとmp3は類似していません。FLACをデコードすると、結果はFLACにエンコードされた元のデータの近似値ではありませんが、まったく同じです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.