簡単な答えは、ドライバの応答を補正するためにオペアンプで構成されたフラットな周波数応答システムは、通過帯域で非常にフラットでない位相応答を持つ必要があるということです。この非平坦性は、トランジェント音のコンポーネント周波数が不均一に遅延することを意味し、微妙なトランジェント歪みが発生し、適切なサウンドコンポーネントの認識が妨げられます。
その結果、ひどい音がします。まるで耳の真ん中に位置するぼやけたボールからすべての音が出ているかのようです。
上記の回答のHRTF問題はこれの一部に過ぎません-もう1つは、実現可能なアナログドメイン回路は因果的時間応答しか持つことができず、ドライバーを適切に修正するには、因果的フィルターが必要です。
これは、ドライバーに適合した有限インパルス応答フィルターでデジタル的に概算できますが、これには小さな時間遅延が必要であり、映画を非常に耳障りに非同期にするのに十分です。
そして、HRTFも追加されない限り、それはまだ頭の中から来ているように聞こえます。
結局のところ、それほど単純ではありません。
「透明な」システムを作成するには、人間の聴力範囲全体でフラットな通過帯域が必要なだけでなく、線形位相も必要です-フラットな群遅延プロット-そして、この線形位相が必要であることを示唆する証拠がいくつかあります驚くほど高い周波数まで継続して、方向の合図が失われないようにします。
これは実験で簡単に確認できます。Audacityやsndなどのサウンドファイルエディタで、使い慣れた音楽の.wavを開いて、1つのチャンネルから1つの44100 Hzサンプルを削除し、もう1つのチャンネルを再調整して、最初のチャンネルをサンプルは編集されたチャンネルの2番目のチャンネルで発生し、再生します。
1/4の100分の1秒の時間遅延であるにもかかわらず、非常に顕著な違いが聞こえます。
これを考慮してください:音は約340 mm / msになるため、20 kHzでは、これはプラスマイナス1サンプル遅延の時間誤差、つまり50マイクロ秒です。それは17 mmの音の移動ですが、欠けている22.67マイクロ秒との違いを聞くことができます。これはわずか7.7 mmの音の移動です。
人間の聴覚の絶対カットオフは一般に約20 kHzと見なされているので、何が起こっているのでしょうか。
その答えは、聴覚テストは、テストの各部分でかなり長い間、ほとんど一度に1つの周波数のみで構成されるテストトーンで行われるということです。しかし、私たちの内耳は、ニューロンをそれにさらしながら音に一種のFFTを実行する物理構造で構成されているため、異なる位置にあるニューロンは異なる周波数に相関します。
個々のニューロンは非常に速く再起動することができるだけなので、いくつかのケースでは、いくつかが次々と使用され続けます...しかし、これは約4 kHz程度までしか機能しません...トーンの知覚は終わります。それでも、脳が非常に傾いていると感じたときにいつでもニューロンの発火を停止するものは何もないので、重要な最も高い周波数は何ですか?
重要なのは、耳の間の小さな位相差は認識できるということですが、音の識別方法を(スペクトログラフィック構造によって)変更するのではなく、音の方向の知覚方法に影響を与えます。(HRTFも変更されます!)聞こえる範囲から「ロールオフ」する必要があるようですが。
答えは、-3dBまたは-10dBポイントでもまだ低すぎるということです。すべてを取得するには、約-80 dBポイントに移動する必要があります。大きな音だけでなく静かな音も処理したい場合は、-100 dBを下回らないようにする必要があります。主にそのような周波数が鋭い過渡音の一部として他の高調波と同相で到着したときにのみ「カウント」されるため、どのシングルトーンリスニングテストがこれまで見られることはほとんどありません。個々の周波数成分が孤立しているため、それらが小さすぎてカウントできない場合でも、神経応答をトリガーします。
もう1つの問題は、とにかく多くの超音波ノイズ源に絶えず衝撃を受けていることです。おそらくその多くは、自分の内耳の壊れたニューロンからのものであり、以前のある時点での過度のサウンドレベルによって損傷を受けています。そのような大きな「ローカル」ノイズでのリスニングテストの孤立した出力トーンを見分けるのは難しいでしょう。
したがって、システムの前に人間のローパスがフェードアウトするためのスペースがあるように(これは、脳がすでに「キャリブレーション」されている独自の位相変調により)、「透過的な」システム設計ではるかに高いローパス周波数を使用する必要があります。位相変調はトランジェントの形状を変化させ始め、それらを時間内にシフトさせて、脳がそれらがどのサウンドに属しているか認識できないようにします。
ヘッドフォンを使用すると、十分な帯域幅を備えた単一のブロードバンドドライバーを持つように単純に構築し、「未補正」ドライバーの非常に高い固有周波数応答に依存して一時的な歪みを防ぐのがはるかに簡単です。ドライバーの小さな質量がこの状態に適しているので、これはイヤホンではるかにうまく機能します。
位相の直線性が必要な理由は、時間領域の周波数領域の双対性に深く根ざしています。これは、実際の物理システムを「完全に補正」できるゼロ遅延フィルターを構築できないためです。
重要なのは「位相の直線性」であり、「位相の平坦性」ではない理由は、位相曲線の全体的な傾きが問題にならないためです。双対性により、どの位相の傾きも一定の時間遅延と同等です。
すべての人の外耳の形状が異なるため、わずかに異なる周波数で異なる伝達関数が発生します。あなたの脳は、それが持っているものに慣れており、それ自身の明確な共鳴があります。間違ったものを使用すると、実際に悪いことに聞こえます。これは、脳が慣れている修正がイヤホンの伝達関数の修正に対応しなくなり、共鳴がキャンセルされないことよりも悪いことになります- 2倍の数の不平衡ポール/ゼロが位相遅延を乱雑にし、グループ遅延とコンポーネントの到着時間の関係を完全に乱雑にします。
それは非常に不明瞭に聞こえるでしょう、そしてあなたは録音によってエンコードされた空間的イメージングを作ることができなくなります。
ブラインドA / Bリスニングテストを行う場合、少なくともグループ遅延をあまり損なわない未補正のヘッドフォンを誰もが選択するので、脳は自分自身に再調整できます。
そしてこれこそが、アクティブなヘッドフォンがイコライズしようとしない理由です。正しく理解するのは難しいです。
デジタルルーム補正がニッチである理由もここにあります。適切に使用するには頻繁な測定が必要であり、ライブで行うのは困難/不可能であり、一般に消費者は知りたくないのです。
主に低音応答の一部である修正中の部屋の音響共鳴は、気圧、温度、湿度がすべて変化するにつれてわずかにシフトし続け、それによって音速がわずかに変化し、それによって共鳴がそれらから離れるように変化するためです測定が行われたときでした。