サンプリングレートを高くすることには数学的な利点がありますか?


18

とにかく20kHzを超える周波数をほとんどの人が聞くことができないことを考えると、48kHzを超えるサンプリングレートを使用するための正確な議論を理解したことはありません。48kHzでは、少し高い帯域幅のローパスフィルターを構築してエイリアシングを除去する方が簡単であることを理解していますが、96kHzで録音したい理由がわかりません。

厳密にデジタルのプロジェクト、つまり、純粋なデジタル合成を使用し、アナログからデジタルに変換されるマテリアルを記録しないプロジェクトの場合、44.1kHzを超えるサンプリングレートを使用する利点はありますか?

他のすべてについて、96kHzを使用することには何の利点もありませんか?後で特定のタイプのDSP操作を適用するときに有益ですか?それとも、耳にとって純粋なプラセボ効果ですか?

注:ここでは、さまざまなタイプのレコーディングプロジェクトに使用するサンプリングレートについて尋ねる他の質問がありますが、ここでは、より高いサンプリングレートの使用をサポートする数学的またはDSP関連の理由で、実際の難しい事実を尋ねています。

回答:


19

2つの重要な理由から、可能な場合は常にダブルサンプリングレートを使用します。

第一の理由:アナログ音源を使用する場合、アンチイメージングフィルターの特性を取り除くため。アンチイメージングフィルターとは何ですか?

私が44100 Hzで録音しているとしましょう。
10 KHz未満の正弦波を記録する場合、グラフにサンプル値をプロットすると、正弦波をはっきりと見ることができます。
22.5KHzの周波数で0dB FSの正弦波をサンプリングすると、サンプルは交互に1と-1を読み取ります。

さて、ここに問題があります。30 KHzの周波数で0 dB FSの正弦波を記録し、サンプルをプロットすると、各サンプルは正弦周期の半分以上を取得し、サンプルを再生する場合は11 KHzの正弦波を返します。(あなたが私を信じないなら、単純な絵を作ってください。)この振る舞いは「イメージング効果」と呼ばれます。

これは、信号をサンプリングする前に、いわゆる「ナイキスト周波数」(サンプリングレートの半分)を超える周波数が存在しないことを確認する必要があることを意味します。既にサンプリングされたサウンドを提供するデジタルサウンドソースを使用する場合、サンプリングレートの半分を超える信号を生成しないようにプログラムしたり、線形位相を使用してすべてをフィルタリングしたりできるため、これはそれほど大したことではありません残りには影響しないブリックウォールフィルター。

ただし、アナログソースから信号をサンプリングする場合、このフィルタリングは信号がサンプリングされる前に行われます。アナログサウンドをフィルター処理する唯一の方法は、電子回路を使用することです。また、フィルターは非常に急な曲線を持つことが想定されているため、フィルターはそのために設計されていなくても、可聴範囲内の周波数に影響します。A / Dコンバーター内には非常に優れたフィルターがあるため、問題は最小限に抑えられていますが、96KHzを使用する場合と比較して、44.1 KHzのオーディオで数日間作業している場合、聴くのが比較的イライラします。96を44.1にダウンサンプリングするときに適用されるフィルターは、もちろんデジタルフィルターであり、おそらくはるかに優れた品質です。そして、それはあなたがすべての仕事を完全に終えたときにのみ適用されるので、気にしません。

第二の理由:ディザリング信号の特性を取り除くため。

24ビットの解像度で記録していて、マスターを16ビットにする予定の場合、丸め誤差をマスクするディザリング信号が必要になります。ノイズは録音に含めるのに適したものではなく、ブロードバンドノイズは丸め誤差をマスキングするのに最適ですが、ノイズシェーピングはディザリング信号に乱れを軽減するために適用される大きな改善です。録音が96KHzを使用して行われた場合、ほとんどのディザリング信号を24KHzより高い周波数にノイズシェーピングできるため、誰にも聞こえません。ディザリングノイズは、プロジェクトを44.1 KHzにダウンサンプリングした瞬間に、最後にフィルター処理された記録の最後にあります。

だから、ボトムライン:アナログのものを録音するときに便利ですか:

  • はい、間違いなく。適切なノイズシェーピングと併用すると、アンチイメージングフィルターによる妨害が少なくなり、ディザリング信号による妨害が少なくなります。

私のソフトシンセにぴったりのデジタル素材を扱うときに役立ちますか?

  • はい、24ビットで作業し、16ビットまでマスタリングする場合に役立ちます。ディザリング信号のノイズシェーピングで多くのことができます。

「彼らは時々ちょうど半分のサンプリングレートを超える信号を生成しないようにプログラムすることはできないので、」 しかし、間違いなく真: 「または、彼らは残りの部分には影響を与えません線形位相ブリックウォールフィルタを使用して、すべてをフィルタリングすることができます」 私はありません確かにそれは可能です。デジタルで生成された波から超音波をフィルターで除去するには、最初に高いサンプリング周波数で生成する必要があります(これはまだエイリアスになりますが、可聴帯域ではそれほどではありません)。すでにエイリアスされている周波数をフィルタリングすることはできません。
エンドリス

3
「現在、記録が96KHzを使用して行われた場合、ほとんどのディザリング信号を24KHzよりも高い周波数にノイズシェイプできるため、誰もそれらを聞くことができません。プロジェクトを44.1 KHzに戻します。」 私もそうだとは思わない。すべてのディザーを除外すると、出力にはディザーがなくなりますか?量子化の歪みに戻りますか?
エンドリス

最初のコメントについて:あなたは絶対に正しいです。私が言いたいのは、デジタル効果を使用しているときは、出力の周波数範囲が考慮されることを期待できるということです。このように言えば、そもそも出力がエイリアスされて出力されたとしても、独自のサンプル周波数を上げてもそれは変わりません。2番目のコメントについて:興味深い。プレダウンサンプリングに使用されるフィルターに完全に依存します。ノイズが戻って画像化された場合、量子化ノイズは明らかにマスクされますが、まったく同じようには聞こえません。最終的なナイキスト周波数付近でノイズを形成すると思います。
ペルマイスター

1
特定の種類の操作では、24KHzを超える周波数成分が20KHzを下回る周波数成分に、またはその逆に変換される場合があります。そのような最初と最後の操作の間でオーディオがより高いサンプリングレートで保持されない場合、中間段階での情報損失は最終出力に可聴的な影響を与える可能性があります。
supercat

12

厳密にデジタルのプロジェクト、つまり、純粋なデジタル合成を使用し、アナログからデジタルに変換されるマテリアルを記録しないプロジェクトの場合、44.1kHzを超えるサンプリングレートを使用する利点はありますか?

はい。いくつかの例:

あなたは周波数の創造ませんしたいです

デジタル合成からのエイリアス

彼らは、高調波、無限の数の生産という点で、多くの広場/ノコギリ/三角波発生器は、単純に書かれているエイリアスと明らかに悪い音されているが。(正しい方形波で..., +1, +1, +1, +1, −1, −1, −1, −1, ...はありません。エイリアスされた倍音は、ポルタメント中にバックグラウンドでラジオチューニングサウンドを生成します。)

サンプリング周波数が高い場合、エイリアシング周波数はオーディオ帯域から遠く離れているため、この効果は減少します。

もちろん、ジェネレーターがエイリアシングを完全に排除する方法で書かれていればより良いでしょうが、ユーザーとしてそれを常に制御できるとは限りません。よく書かれたものでさえ、通常は妥協であり、「縮小された」エイリアシングは完全に帯域制限されていないため、高いサンプリングレートが依然として役立ちます。

デジタル歪みからのエイリアシング

同様に、あらゆる種類のデジタル非線形歪みを使用すると、無数の高調波または相互変調積が生成されます。ナイキスト周波数よりも高い周波数で生成されるものは、実際には可聴範囲にエイリアスされます。

帯域制限された方法歪めることは理論的には可能ですが、プラグインコーダーが実際にこれを行うことは一般的ではありません。私がテストしたすべてのギターディストーションプラグインには、エイリアシングがあり、96 kHzでの処理も可能です。

これが実際にどれほどの問題なのかはわかりません。コンプレッサーやボリュームフェードのように、多くのことが少量の歪みを引き起こしますが、その量はすでに無視できるため、エイリアス量はさらに無視できます。歪みが大きい場合、エイリアス周波数はノイズに埋もれているため目立たない場合があります。とにかく、サンプリングレートを高くすると、有害な影響を最小限に抑えることができます。

周波数の欠如あなたが行う希望を

別の考えられる懸念は、合成された超音波周波数は、録音で直接聞こえなくても、後の処理で役立つ可能性があることです。

時間変化からの周波数シフト

サウンドフォントプレーヤーのように、ウェーブをリサンプリングしてスローダウンさせると、これらの超音波周波数は可聴周波数になります。低いサンプリングレートでのエイリアシングを回避するためにそれらを除外した場合、スローダウンしたサウンドはハイエンドを失います。

歪み/変調

前に述べたように、歪みは、元の録音の周波数から和と差の位置に新しい相互変調周波数を作成します。今回は、(エイリアシングに関係しない)超音波周波数の歪み/変調によって生成される望ましい可聴周波数が心配です。これらの超音波周波数が歪みの前に録音にない場合、出力はそれらが生成する可聴周波数を失い、同等のアナログ効果を正確にエミュレートしません。

繰り返しますが、これが実際に問題であるかどうかはわかりませんが、少なくとももっともらしいことであり、超音波を含むより高いサンプリングレートで改善されます。

一般に、より高いサンプリングレートで作業すると、効果や正しく実装されない可能性のあるものに関する問題を防ぐための「ヘッドルーム」が得られます。コピーをコピーするように、各コピーの品質が高いほど、最終製品の劣化が少なくなります。

再生には役に立たない

これは、完成したミックスを再生するために、より高いサンプリングレートが良いアイデアであると言うことではありません。そうではありません。上記のように、超音波の歪みは可聴音を生成する可能性があり、スピーカーはオーディオチェーンの中で最も線形性が低いため、最終的なミックスから超音波を排除してスピーカーによる歪みを防ぎます。

音楽再生のサンプリングレートを高くしてもメリットはありません。記録および処理段階でのみ使用する必要があります。参照してください192分の24件の音楽のダウンロードを...と、なぜ彼らは意味をなさない


1
誤った方形波ジェネレーターについて言及する場合は+1。また、同じことが...鋸歯状と三角形波についても
Sargeのボルシチ

96KHz以上のレートへのデジタルアップサンプリングは、22Khzから48KHzの範囲で不要なコンテンツを簡単にオーディオ出力に保持できるため、再生に役立ちます。22Khz未満を傷つけずに約48Khzを殺すアナログフィルターを構築することは、22Khz未満を傷つけずに26Khzを超えるすべてを殺すよりもはるかに簡単です。オーディオを再生のために96Khzに変換し、それを96Khzに保持する場合、ダウンコンバートおよびアップコンバートするのではなく、96Khzに保つこともできます。
supercat

@supercatこれは記録用であり、再生用ではありません。超急峻なデジタルフィルターを作成して、再生前に20 kHzを超えるすべてを削除するのは簡単です。サンプリング前に超音波を除去するためにアナログフィルターを作成することは困難/高価です。そのため、ADCははるかに高いレート(MHz)でオーバーサンプリングを使用し、デジタルフィルターを使用して超音波を除去し、96 kHzのような通常のレートに戻します。
エンドリス

5

効果のためのヘッドルームを確保することは、人間の聴覚制限の2倍よりも高いサンプリングレートを使用する理論上(および実際上)有効な理由です。

この理由は、画像編集と比較することで簡単に視覚化できます。高コントラストのレンガの壁、網、縞模様のテキスタイル、または他の細かい間隔の高コントラストテクスチャの全体ショットで800x600ピクセルの画像しかない場合、モアレ効果を生じさせず、細部をぼかすことなく、45°の倍数。オーディオでは、編集で発生する歪みの用語は異なりますが、同じナイキストシャノンサンプリング定理の原則が適用されます。エイリアシングは、サンプリングされた音の周波数成分がサンプリングレートの半分を超える場合(ナイキスト周波数と呼ばれる)、「イメージング効果」よりも一般的に使用される用語です。

実際には、既に説明したPelle ten Cateのように、レンガ壁のローパスフィルターは実現できませんが、カットオフには常に何らかの勾配(勾配)があります。

高いサンプリングレートで録音するもう1つの正当な理由は、人間の聴覚の大部分は耳の間の小さな時間差(約5〜20ミリ秒、物理的には位相差)に依存しているため、より正確なステレオイメージを実現することです。頭の「影」やその他の側面も役割を果たします。

オーディオCDのサンプリングレートが44100 Hzの場合、各サンプルは22.6マイクロ秒を表し、たとえば882 Hzの周波数の1周期には50個のサンプルがあります。また、20ミリ秒の遅延というかなり長い遅延は、50サンプル続きます。そのため、その中間周波数で25サンプルのみが180°位相キャンセルを意味します。

したがって、44,1 KHzのサンプリングレートで十分ですが、実際には編集のための余地はあまりありません。

留意すべきもう1つのことは、量子化ノイズを防ぐためにディザリングを使用することです(画像編集と同様)。次に、16ビットではなく24ビットの量子化を使用する必要がありますか?


超音波は、意識して聞こえなくてもステレオ知覚に影響を与えることが示されていますか?
エンドリス

1
いいえ、ステレオ画像に対する両耳間時間差の影響は、耳の距離が波長よりも短い低周波数(1500 Hz未満)に最も影響するため、位相差があります。より高い周波数では、音のレベルの違いが音の定位により大きな影響を与えます。参照:en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil

4

より高いサンプリングレートを使用するもう1つの理由は、プラグインの実装の欠陥を回避することです。多くのプラグイン作成者は、非線形信号操作の帯域幅拡大効果を適切に考慮していないため、ボックスを離れる前にエイリアシング効果を得ることができます。

たとえば、コンプレッサーは基本的に電圧制御アンプです。1つの信号(オーディオ信号)と別の信号(ゲイン)を乗算します。2つの信号の乗算は、リング変調またはヘテロダインとも呼ばれます。2つの入力の和信号と差信号を生成する効果があります。15 kHzの正弦に10 kHzの正弦を掛けると、5 kHzと25 kHzの成分を持つ出力信号が得られます。コンプレッサーのゲインのアタックが非常に速く、入力信号の帯域幅が広い場合、「和」成分信号が過渡的にFs / 2制限を簡単に超えてしまい、出力に偽の低周波ジャンクが発生する可能性があります信号。

これに対する実際の修正は、内部的にオーバーサンプリングを使用してプラグインを実装することですが、それが得られない場合は、できるだけ高いFsでシステムを実行することが最善です。成層圏には実際のオーディオコンテンツはありませんが、境界を越えて吹き飛ばされるプラグインから保護されています。


2

少なくともオーディオの世界のニーズに対する数学的根拠は、それが価値のあるものであるために、ナイキスト・シャノンのサンプリング定理によって一般的に説明されます。最大周波数n Hzの波形では、1秒あたり2nサンプルが必要です。


1
はい。ただし、ナイキストシャノンはブリックウォールフィルターを使用していますが、これは物理的に不可能です。
エンドリス

1

複数のトラックで録音する場合、サンプリングレートよりもビット深度が重要だと思います。

したがって、たとえば、16ビットよりも24ビットの方が優れています。これは、トラックがミックスダウンされる方法と、十分なビットがない場合に「丸めエラー」と呼ばれるものに関係しています。

ほとんどのハードウェアとソフトウェアは、96kと24bitを簡単にサポートできるようになりました。

とはいえ、明らかに古い16 / 44.1機器を使用して高品質の録音を行うことができます。

装備よりも才能の方が重要です。


2
これは「正しくない」わけではありませんが、24ビットで作業すると、16ビットに戻したい場合にディザリングを使用する必要があるという欠点が生じます。ノイズシェーピングの使用時に96 KHzの信号に適用すると、ディザリングノイズを大幅に減らすことができます。(詳細については他の回答を参照)
ペルマイスター

1
すべてのプロフェッショナルオーディオソフトウェアは、録音中に使用されるビット深度に関係なく、ミックス中に32ビットまたは64ビットの浮動小数点で内部的に動作します。
左辺約

3
@PelletenCateは、16ビットで作業している場合、各ねじ込みの編集ステップで量子化ノイズを追加するため、すでにねじ込まれています。これは、24ビット以上で作業するとこのような欠点が生じることを意味するのは非常に間違っています。
セージボルシュ

私はそれを+1しました。それを欠点として説明するべきではありません。ただし、44/16ミックスでは、量子化ノイズと不定形のディザリングノイズの両方が聞こえます。私のポイントは、24ビットに切り替えることで、1つの問題(量子化ノイズ)を別の(ディザリングノイズ)に変更する機会を与え、それをより高いサンプリングレートで録音することで効果的に減らすことができるということです。
ペルマイスター

0

「...より高いサンプリングレートの使用をサポートする、数学またはDSP関連の理由のための実際の難しい事実。」

いわゆる実際の事実は実際のオーディオエンジニアからのものであり、ここでいくつかを見つける可能性がありますが、実際のエンジニアが書いた記事をインターネットで検索する方が高速です。ここで質問するということは、あなたが私たちに落ち着くことを意味します。私はオーディオエンジニアではありませんが、検索ツールは使用できます。

考慮すべきことは、ノイズフロアです。他の答えは、ノイズを追加する方法とディザリングと量子化エラーについて言及していますが、フロアについて言及するのに最も近い他の答えは、このちょっとしたことでした:「... 「。

建設現場、鉄道駅、または造船所で録画している場合、完璧を求めていない場合は安価で44.1で録画できます-そうでなければ、ビデオは4:2:0ではなく4:2:2のようになりますオーディオは32ビット以下(YOUの場合は内部で32以上)、より高いサンプルレートの場合は96 kHz以下(ここでも、より高いサンプルレートで動作するソフトウェアとハ​​ードウェアを内部で使用します)。

これらの記事を試して、エンジニアのアドバイスの検索を開始してください-法律上のアドバイスにはアクセスしません。重要な情報をスタック交換するので、学ぶことを学びます。最終的には、あなたがどれだけ気にかけているか、観客がどれだけ気にかけているか、あなたのスキルレベル、そして何ができるかです。

なぜ88.2- http://www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

なぜ24/96なのか?- http://www.premiersoundfactory.com/modules/pico/content0035.html

無料のオンラインコースを含む、インターネット上の多くの場所。

短いバージョンには理由があり、それは難しい事実です-最初にエラーを投げたり、後で切り抜いたりしないでください。記録しようとしているときに誰かが話したり、ショットを実行している見知らぬ人が欲しくないでしょう-しかし、それと多くの親指の両方を持つビデオがあります。

覚えておくべきハックは、できる限り高いレート(時間、ストレージスペース、スキル、お金、入力の種類(IE:建設現場)、聴衆)でクリッピングせずに大声で記録し、ノイズ除去で最も静かなニュアンスを切り落とすことですお粗末な量子化とディザリングノイズ(言及したまで気付かなかったかもしれません)。

[事実に誤りのない単純な答えを意図して書かれており、オーディオ愛好家やプロのオーディオエンジニアを怒らせることを意図していない]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.