WAVEファイルに保存された値について


7

waveファイルで見つけられる値、例えば

    0.0036
    0.0026
    0.0174
    0.0050
    0.0026
    0.0108
    0.0154
   -0.0114
   -0.0006
    0.0115

あると思いますが、-1と1の間の相対値です。オーディオ編集プログラムで波形を見るときに通常表示される範囲です。では、ファイルを再生すると、これらの相対値はどのようにマッピングされますか?たとえば、値が0.5の場合、それは最大可能ラウドネスの半分での再生を意味しますか?相対値が参照するWAVEファイルに何らかの参照値が保存されていますか?

別のこと:上記の例では、7つの正の値の後に2つの負の値が続きます。それで、スピーカーで振動して音を生み出す膜は、他の方向よりも一方向に長く押されますか、またはこれをどのように解釈する必要がありますか?正の値は振動の1つの方向であり、負の値は別の方向への振動です。または、これは間違っていますか?

どうもありがとうございました :-)

回答:


7

表示されているのは、時間の関数としてのある休止位置からのスピーカーの変位に対応する時間領域サンプルです。たとえば、最初のサンプルはでの膜の位置に対応し、次のサンプルはでの位置を表します。サンプル間に秒があると仮定します。オーディオの一般的なサンプリング間隔には、秒と秒があります。t=0t=TTT=18000T=144100

サンプルのストリームを実際のオーディオに変換するには、最初にデジタルアナログコンバーター(DAC)を使用して、サンプルに対応する時変アナログ電圧を生成します。このアナログ電圧は、スピーカーを駆動するパワーアンプの入力に適用されます。スピーカーは、その膜の位置がスピーカーの入力電圧に比例して変化するように設計されています。このチェーンの最後には、元のオーディオサンプルに従って移動するスピーカーメンブレンがあり、振動によって目的のオーディオを生成します。

ように、サンプル値は範囲に正規化されています。結果として生じるオーディオのラウドネスは、スピーカーを駆動するアンプのゲインやDACの出力電圧範囲など、多くの非デジタル要因の影響を受ける可能性があります。ピークサンプル値は、「ハードウェアが生成できる最大の膜変位」に対応しています。したがって、そのようなサンプルのストリームでオーディオの絶対的なラウドネスをエンコードする方法はないため、このような正規化スキームを使用します。±1±1


2

オーディオファイルを再生するとき、デバイスには通常、何らかのボリュームコントロールがあります。したがって、0.5は、そのボリュームコントロールの現在の設定で許可されている最大ボリュームに関連しています。

さらに、サンプルからスピーカーへのパスには周波数応答があり(DCから光までフラットではない可能性があります)、スケーリングされた波のサンプルの値から実際のスピーカーの変位が変更されます。ほとんどのオーディオシステムの周波数応答はDCを通過しないため、スピーカーの応答はDCオフセットを除去し、十分に長い期間にわたって実際の物理的な正と負の変位のバランスをとる可能性があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.