PCM 16ビット署名済みオーディオの音量を変更するにはどうすればよいですか?


7

サンプルを乗算してからクリップすることはできますが、知覚されるボリュームは人間にとって非線形です。

式を手伝ってくれませんか。


なぜこの質問は反対票が投じられたのですか?これは明らかにこのボードに関連しています。
ジム・クレイ

3
質問は文法的にも明確に定式化されていません。それ以外に、どのような非線形性を補償したいですか:振幅のみ、または周波数依存の振幅?
heltonbiker

私はこのミニチュートリアルを読みました:ypass.net/blog/2010/01/…そして、この男はtan関数を使用してボリュームを線形ではなくしましたが、彼はこれは完璧な方法ではないと言いました。それで、私はそのDSPフォーラムで考えました。
黙示録

その質問は非常に簡潔で明確です。オーディオを操作すると、@ zgnilecの意味がすぐにわかります。これは心理音響学の問題です。人間の音量の知覚は非線形です。したがって、問題は「線形と認識されるオーディオゲインの変更をどのように行うのか」です。
sebpiq 2015

-48dB〜+ 6dBの範囲では、振幅が54dBになります。
999年

回答:


12

オーディオ信号の音量を変更するには、ゲイン(乗算)を適用し、システムのダイナミックレンジが限られている場合はオプションでクリッピングを行う必要があります。これはそれと同じくらい簡単です。非線形関数をオーディオ信号に適用すると、歪みが発生し、高調波が追加されます。これが発生するのは望ましくありません。信号の音色ではなく、音量を変更したい場合です。[公平に言うと、特定のダイナミックレンジ制約(マルチバンド圧縮など)内で、音色に影響を与えずに信号の知覚ラウドネスを変更するように設計された非線形処理がありますが、これは必要なものではないようです。]

非線形性と派手な応答曲線が機能するのは、ユーザーインターフェイスを設計するときです-コントロール(ノブまたはスライダー、GUI上または物理的なハードウェアとして)の位置と信号に適用されるゲインとの関係を決定するとき。ユーザーはスライダーの位置とラウドネスの知覚の間のマッピングを期待するため、これは知覚が重要な場所です。ボリュームコントロールの位置と信号に適用されるゲインの関係が非線形である場合でも、信号にゲインを適用するプロセスは線形であり、非線形性は必要ありません。

たとえばhifiシステムやパーソナルオーディオプレーヤーなどの物理的なボリュームコントロールの場合、ノブの位置と減衰の関係は指数曲線に近くなりますが、その形状は微調整されており、製造プロセスによって制約されています。 2つまたは3つの線形セグメント。これらの曲線は、メーカーデータシート( "A"テーパ)で確認できます。ミキシングコンソールフェーダーは通常、応答が圧縮されているため、移動量の上半分は-20 dB .. + 6dBの有効範囲をカバーしています。

ソフトウェアの世界では、少なくとも音楽制作では、ボリューム/ゲインのノブをdB単位で調整するのが最も一般的です。たとえば、-48dBから+ 6dBに段階的に変化する100ピクセルの長いボリュームスライダーがある場合、信号に適用されるゲインは。1048+54x10020


xが0 = 24の場合、x = 100は3になります。これは正しいですか?これを理解するのにもっと時間が必要です:<
黙示録

10 **((-48 + 54 * 0 / 100.0)/ 20.0)= 0.004; 10 **((-48 + 54 * 100 / 100.0)/ 20.0)= 1.995
ピシェネット2012

これは指数であり、乗算ではありません。10 ^、10ではなく*
ピシェネット

54はどこから来たのですか?
AnsisMāliņš2017
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.