ロスレスオーディオの変換と(圧縮解除)圧縮について


12

ロスレスオーディオに関していくつか質問があります。音楽コレクション全体をロスレス.flacにリッピングすることを検討していますが、最初にいくつかのことを理解したいと思います。

.flacのファイルがあり、たとえば.wavにしたい場合、どうすれば品質を落とすことができますか?解凍すると、品質を失うことはありません。.flacから.wavへの変換は、解凍と同じですか?

これは.ape形式にも適用されますか?.apeでダウンロードしたパブリックドメインのレコーディングがいくつかありますが、.flacにしたいです。.wavを仲介者として使用しなくても、.apeから.flacが可能です。少しでも失われないようにします。

また、ロスレスの世界を完璧に説明するガイドがあれば、だれでもリンクを共有してくれるでしょうか?:)

回答:


14

最初:

エンコーディングコンテナ形式の違いを理解する。http://en.wikipedia.org/wiki/Digital_container_format

コンテナ形式は、他のエンコードされたデータを「カプセル化」するデータ形式です。多くの場合、エンコードされたデータに関する「メタ情報」が含まれているか、エンコードされたデータの複数の個別のストリームなどを保存する方法があります。

コーデックによって生成されるエンコーディングは、データストリームの実際の「肉」です。

私が考えることができる最も一般的な例は、フォーマット「Ogg / Vorbis」です。Oggはコンテナ形式で、Vorbisはエンコーディングです。したがって、Ogg形式のファイルがあり、内部にはエンコードされたデータを含むこれらの小さなバケットがあります。各バケット内には、Vorbisでエンコードされたデータストリームがあります。たとえば、バケツにアーティストの名前と曲のタイトルが刻印されている場合があります。

技術に戻りましょう:

  1. mp3やogg / vorbisなどの損失の多い形式の音楽を既に持っている場合、損失のない形式に変換すると、(多くの)ディスク領域が消費されるだけで、品質は向上しません。オーディオは何でも。既に失われている忠実度を作成することはできません。CSIと呼ばれるヒットテレビ番組でVisual BasicでGUIインターフェイスを記述している場合を除き、それはファンタジーであり、現実ではありません。

  2. 他のロスレス形式の音楽があり、FLACに変換したい場合は、そうすることができます。

  3. 「WAV」という用語に注意してください。Wavはロスレスではありません。実際、WAVはさまざまな可能な形式の単なるコンテナーです。その意味では、AVIのようなものです。生のPCMデータであればロスレスWAVを作成できますが、MPEG-1レイヤーIIIデータ(損失のある)をWAVファイルに埋め込むこともできます。

  4. データの忠実度を下げると、あるロスレス形式から別の形式に変換するときにデータを失う可能性があります。たとえば、48000 Hzの符号なし16ビットPCMデータストリームを44100 Hzの8ビットPCMデータストリームに変換する場合、2つの方法で忠実度が失われます。サンプルは48000からわずか44100にマージされます2番目(データが失われる)、データをダウンミックスして、情報をサンプルごとに16ビットではなく8ビットのみに収める必要があり、品質が大幅に低下します。

すべてのデジタルオーディオストリームは、圧縮(損失または損失のない)エンコーダーでエンコードされたものも含め、次の「サンプル形式プロパティ」を持ちます。これは、ストリームのプロパティを記述する重要な要素です。

  1. サンプルのビット幅とビット深度、つまり8ビット、16ビットなど。ビット幅と深度は微妙に異なり、リトルエンディアン/ビッグエンディアン(品質に影響を与えない)および符号付きまたは符号なし(これも影響しません)品質には影響しますが、エンコーダ/デコーダがデータを処理する方法には影響します)。覚えておくべき重要な点は、「ビットが多いほど良い」ということです。したがって、32ビットは16ビットなどよりも優れています。

  2. サンプリングレートとも呼ばれる周波数。1秒間に再生されるオーディオの「サンプル」が多くなるため、多ければ多いほど良いです。カードのデッキにすばやく指をかけ、ぼやけてカードが通り過ぎるのを見ると想像できます。これがデジタルオーディオの本質です。各サンプルはカードであり、毎秒飛行するカードが多い場合、音声はよりシームレスになります。同様に、1秒間に5枚のカードをめくっていると本当に気づきますが、1秒間に数千枚のカードをめくろうとすると、すべてがぼやけます。アナログで無限に割り切れる(よりプランクのユニットまでですが、それは議論の余地があり、話題にならない)より自然で現実に近いので、より良いのです。

「ロスレス」とは、入力で使用したのと同じまたはより良いサンプル形式を出力で使用しても、データが失われないことを意味します。

したがって、16ビットから32ビットのサンプル形式に移行しても、データは失われません。ただし、32ビットから16ビットに変更すると、データが失われます。

FLACを使用する意味があるかどうかという質問に対する答えは、ソースデータに依存します。元々そのサンプル形式で192000 Hz(別名192KHz)で記録された64ビットWAVファイルがあり、標準」16ビットおよび44.1 KHzのFLACサンプル形式では、データのトンが失われます。ただし、WAVファイルが1秒あたり22100サンプルのみの8ビットであり、1秒あたり44100サンプルの16ビットFLACに変換する場合、データは失われません。また、ロスレス圧縮または小さいサンプル形式のどちらが優先されるかによって、ファイルサイズが大きくなることもあります。

サンプル形式は、ファイルが占有するスペースに影響を与えるため、「より大きな」ビットと「より速い」サンプリングレートがより多くのスペースを占有します。

実際的な懸念と人間の耳に関しては、本当に忠実度の高いオリジナルを16ビット44.1KHz FLACに変換しても気付かないでしょう。ただし、MP3をFLACに変換しても改善は見られません。そのため、何をするかを決める前に、ソースデータがどのサンプルフォーマットであるかを評価する必要があります。

これらすべての情報を提供しましたので、ここであなたの質問に対する私の直接的で明確な、説明のない答えを示します。

ロスレスオーディオに関していくつか質問があります。音楽コレクション全体をロスレス.flacにリッピングすることを検討していますが、最初にいくつかのことを理解したいと思います。

あなたの音楽コレクションがCDにあり、FLACにリッピングしたい場合、それは私の意見に非常に適しています。CD品質のオーディオは44.1 KHzで、サンプルあたり16ビットです。これは、FLACのデフォルト設定(少なくとも、使用するエンコーダーのデフォルト設定)と正確に一致します。したがって、データが失われることはなく、デコード時に入力データと数学的に同一になります。

.flacのファイルがあり、たとえば.wavにしたい場合、どうすれば品質を落とすことができますか?解凍すると、品質を失うことはありません。.flacから.wavへの変換は、解凍と同じですか?

入力データと同じまたはより広いサンプル形式の.wavファイルに変換でき、品質の損失はありません。

メディアプレーヤーがflacファイルのオーディオを再生する場合、そのPCMデータをサウンドカードに送信する前に、基本的にflacデータをPCM形式にデコードしています。入力されたデータとまったく同じデータに解凍します。16ビットの44.1 KHz PCMデータが入力された場合、それが出力され、スピーカーに送られます。

このアクティビティとオーディオをWAVファイルに変換する唯一の違いは、WAVファイルに変換する場合、適切なフィラービットなどを使用してWAVコンテナを作成する必要があり、サンプル形式も選択できることです。 WAVファイルの。ただし、サンプル形式が同じであると仮定すると、FLACファイルとWAVファイルの唯一の違いはファイルサイズになります。WAVファイルはかなり大きくなります。

これは.ape形式にも適用されますか?.apeでダウンロードしたパブリックドメインのレコーディングがいくつかありますが、.flacにしたいです。.wavを仲介者として使用しなくても、.apeから.flacが可能です。少しでも失われないようにします。

いいえ、仲介者としていくつかの PCM形式を使用せずにこれを行うことはできません。しかし、はい、WAVファイルを使用せずに実行すること可能です。違いに注意してください。PCMデータストリーム。WAVファイル。区別が明確でない場合は、私の投稿の冒頭を読み直してください。「少しでも」が失われないようにする場合は、APEファイルを調べて、それらのファイル形式を理解し、FLACエンコーダーが同じ設定でエンコードするように設定されていることを確認する必要があります。

内部的には、オーディオ変換プログラムはソース形式からある種のロスレスPCMサンプル形式にデコードし、それらのPCMサンプルを取得して宛先形式で再エンコードします。

また、ロスレスの世界を完璧に説明するガイドがあれば、だれでもリンクを共有してくれるでしょうか?:)

私の意見では、学ぶ最良の方法はそうすることです。Gstreamerフレームワーク、その使用方法、サンプル形式のさまざまな調整可能パラメータの意味、およびパイプラインの構築方法を学ぶのに時間をかけると、デジタルオーディオの非常に強力な理解が得られます。見てみな。http://gstreamer.freedesktop.org/また、http: //code.entropywave.com/gstreamer-sdk/からGstreamer SDKを取得し(Windowsをサポート)、何もコンパイルせずにgst-launch-0.10を試すことができます。ソースから。

いくつかの明らかなこと:

gst-inspect-0.10 vorbisenc gst-inspect-0.10 vorbisdec gst-inspect-0.10 audioconvert gst-inspect-0.10 audioresample

次に、上限、パイプラインの構築などについて学びます。

*注:PCMが何であるかを説明しなかったことに気付きました。ウィキペディアは、私よりも優れた仕事をしています:http : //en.wikipedia.org/wiki/Pulse-code_modulation


うわー、これはあなたがこれをどれほど明確に、そしてどれほど優れて説明したかということだけです。これまでにこれらの半分を考えたことはありませんでした。回答、そしてこれもすべて入力するのにかかった時間をありがとう!+1!
ライアンマクルーア

ロスレスは理想的には同一のPCMデータを意味するため、常にビットレートとサンプルレートを維持することを目指してください。サンプルレートの2倍以外へのアップサンプリングは、ロスレス(ゼロを均等に追加することはできません)にならず、ディスク領域を無駄にします。いずれの場合でも、FLACはサンプルあたり4〜32ビットのPCMビット解像度、1 Hz刻みで1 Hz〜655,350 Hzのサンプリングレート、1〜 8(en.wikipedia.org/wiki/FLAC#Design
mtone

WAVには常にPCMが含まれています。これは、CD品質のPCMではないかもしれません(ただし、実用的に言えば、それはほとんど常にそうであるので、あなたは一般的に、これを想定することができる)が、それはPCM、MPEGのような他のないものになり3層2
psusi

@psusi:申し訳ありませんが、あなたは間違っています。WAVに関するウィキペディアの記事:en.wikipedia.org/wiki/WAVをお読みください。必要に応じて、MP3オーディオを含むWAVファイルへのリンクを投稿できます。WAVファイルについて留意すべきことは、それらは単なるRIFFファイルであり、RIFFファイルはメディアコンテナ形式のかなり原始的なリビジョンであることです。しかし、少なくともその基本的な目的では、ビデオではなくオーディオのみをサポートすることを除けば、OggやMatroskaとそれほど違いはありません。編集:wav / mp3ファイルを作成する必要はありません。わーい!実際、Wikipediaからリンクされています!nch.com.au/acm/8kmp316.wav
allquixotic

この回答にはいくつかの不正確さがあります。「周波数。サンプリングレートとも呼ばれます。1秒あたりに再生されるオーディオの「サンプル」が多いため、多いほど良いです。」-これはサンプルレートの仕組みではありません。ビット深度が関係していなければ、48kHzのサンプルレートのデータは最大24kHzの信号をロスレスで表すことができ、サンプルを追加してもそれは変わりません。より多くのサンプルは、表現できる周波数にのみ影響します。導入されたエラーがめちゃくちゃ小さい場合でも、44.1khzから48khzへの変換も厳密に言えばロスレスではありません。
cooky451

1

私はallquixoticの声明に反対しなければなりません。

mp3やogg / vorbisなどの損失の多い形式の音楽を既に持っている場合、損失のない形式に変換すると、(多くの)ディスク領域が消費されるだけで、品質は向上しません。オーディオは何でも。既に失われている忠実度を作成することはできません。CSIと呼ばれるヒットテレビ番組でVisual BasicでGUIインターフェイスを記述している場合を除き、それはファンタジーであり、現実ではありません。

オーディオエンジニアリングの知識が不足しており、虚偽の陳述を人々に与えている。

  1. OggとVorbisの両方には、元のWaveデータ情報を保存するコンテナがあり、そのデータでロスレスに変換できます。グーグルで十分やってください。

  2. 低品質のMP3からロスレスへの変換でさえ、多くのサウンドを改善しますが、オリジナルほど完璧ではありませんが、ダイナミクスとディザリングで簡単に修正できます。https://www.izotope.com/en/products/master-and-deliver/ozone.html/OzoneDitheringGuide.pdf

オーディオは10100110101001データではないため、ファイルサイズを小さくしても品質が低下するわけではありません。数十年前に128kbpsから320kbpsを使用した経験があるかもしれませんが、128kbpsからロスレスを推測することは不可能です。この簡単なタスクを自分でテストして、実現してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.