16ビットwavを8ビットwavに変換するとノイズが発生するのはなぜですか?


3

16ビット/ 8000HZ /モノ/ PCMの.wavファイルがいくつかあります。電話システムで使用するには、8ビットに変換する必要があります。

しかし、変換後、ソース音全体が無音であっても、8ビットの.wavファイルに多くのノイズが現れることがわかりました。(Audacityを使用して無音を生成し、16ビットMicrosoft WAVにエクスポートしてから、8ビットMicrosoft WAV(その他の非圧縮ファイル)にエクスポートして、何が起こったかを聞くことができます)。

私はそのような変換を行うためにAudacitysoxCoolEditトライアル)を試しましたが、それらはすべて変換後にノイズを生成します。

これはどうしてですか?これを回避する方法はありますか?

回答:


5

参照しているノイズがディザである可能性があります。多くのビットレート変換アルゴリズムは、変換前に信号に低振幅、多くの場合周波数に整形されたノイズであるディザーを追加します。ほとんどの場合、このノイズは実際に変換の可聴品質を向上させます。ディザリングが必要ない場合は、アプリケーションの環境設定でディザリングを無効にできれば幸いです。


3

8ビットの音が聞こえない場合、どのようなノイズについて話しているのかを判断するのは困難ですが、考えられる問題がいくつかあります。

(1)16ビットから8ビットに変換すると、常に一般的な品質の損失が発生します。結局のところ、情報は捨てられます。

(2)16ビットサンプルが正規化されていない場合(つまり、16ビット範囲全体のごく一部しか使用していない場合)、8ビットに変換したときに品質が非常に低下します-最初に正規化して、変換後に8ビット範囲全体を使用します。

(3)符号付き(2の補数)と符号なし(オフセット)の2つの一般的で異なる8ビット音声表現があり、後者がより一般的です。間違った形式を使用する場合、つまり、ある形式に変換した後、別の形式を想定して再生しようとすると、音声は認識できますが、音質はかなり悪くなります。

(4)テレフォニー(音声)アプリケーションでは、線形ではなく8ビットオーディオに非線形(対数)エンコードを使用するのが一般的です-最も一般的な2つはA-lawµ-lawです。ただし、変換された8ビットオーディオは線形です。A-lawまたはµ-lawを想定しているテレフォニーアプリケーションでリニアPCMを使用しようとすると、歪んだ混乱のように聞こえます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.