アクティブなヘッドフォンがフラットな周波数応答にイコライズされないのはなぜですか?


11

一部のヘッドフォンは「アクティブ」で、アンプがカップに組み込まれていて、電源(通常は単4電池)が必要です。

それから私は多くのオーディオファンが周波数応答をどれほど優れたヘッドホンが優れているかの測定基準として論じているのを見ます、そして彼らはDre Beats Studioのようなほとんどの「アクティブな」ヘッドホンを断固として却下します。

ただし、一部のオペアンプでは、ドライバーの周波数応答を完全に補正し、必要に応じて(または低音など)非常にフラットな周波数応答を生成できるように、事前増幅された入力信号をイコライズするのはかなり簡単に思えますブーストまたはカット)。

そうすることで特に難しいことはありますか?

周波数応答グラフhttp://graphs.headphone.com/graphCompare.php?graphType=0&graphID[]=1383&graphID[]=193&graphID[]=1263&graphID[]=853&scale=20

たとえば、Dre Beats Studio(青い線)の場合、EQ回路は+ 3db @ 750Hz、-5dB @ 1100Hz、+ 6.5dB @ 1300Hz、+ 5dB @ 1550Hz、-4.5dB @ 8.5kHz、および+ 14dBを提供できます。 @ 15kHz、スロープを調整して、周波数応答を500Hzから20kHzの0dbに最適に合わせる。

回答:


20

標準のステレオ録音を再生する耳に何かを置くとき、音源が耳に当たっていない場合、通常はるかに離れた音源に対して作用する頭部関連の伝達関数は非常に異なって見えるため、フラットな周波数応答は必要ありません。。

本からいくつかの段落を引用させてください:

電気音響伝送チェーンのすべてのコンポーネントの中で、ヘッドフォンは最も物議を醸しています。音色だけでなく空間定位も含む、本当の意味での高い忠実度は、よく知られているヘッドホンの頭内定位により、スピーカーのステレオフォニーに関連しています。さらに、実際の高忠実度で最も有望なダミーヘッドを使用したバイノーラル録音は、ヘッドフォンの再生を目的としています。彼らの全盛期でさえ、彼らは日常のレコーディングと放送の場所を見つけられませんでした。当時の原因は、信頼性の低い正面の位置特定、スピーカーの再生との非互換性、および美的でない傾向でした。デジタル信号処理(DSP)は、バイノーラルヘッド関連の伝達関数(HRTF)を使用して日常的にフィルター処理できるため、ダミーヘッドは不要になりました。

それでもヘッドフォンの最も一般的な用途は、元々はスピーカー用に意図されたステレオ信号をそれらに供給することです。これは、理想的な周波数応答の問題を提起します。マイクロフォン、アンプ、スピーカーなど、伝送チェーン内の他のデバイス(図14.1)の場合、通常、フラットな応答が設計目標であり、特別な場合にこの応答からの逸脱を簡単に定義できます。通常1 mの距離でフラットなSPL応答を生成するには、スピーカーが必要です。この時点での自由音場SPLは、録音されているコンサートなどの音場のマイク位置のSPLを再現します。LSの前で録音を聴きながら、リスナーの頭が回折によってSPLを直線的に歪めます。彼の耳の信号はもはやフラットな反応を示していません。しかしながら、これは、スピーカーの製造元に関係する必要はありません。これは、リスナーがライブパフォーマンスに参加していた場合にも発生するためです。一方、ヘッドフォンの製造元は、これらの耳信号の生成に直接関与しています。規格に定められた要件により、フリーフィールドキャリブレーションヘッドホンが生まれました。このヘッドフォンの周波数応答は、スピーカーの前面の耳の信号を複製し、拡散フィールドキャリブレーションは、SPLを耳の中に複製することを目的としています。あらゆる方向から衝突する音のリスナー。多くのスピーカーは、それぞれがフラットな電圧応答を持つインコヒーレントなソースを持っていると想定されています。ヘッドフォンの製造元は、これらの耳信号の生成に直接関与しています。規格に定められた要件により、フリーフィールドキャリブレーションヘッドホンが生まれました。このヘッドフォンの周波数応答は、スピーカーの前面の耳の信号を複製し、拡散フィールドキャリブレーションは、SPLを耳の中に複製することを目的としています。あらゆる方向から衝突する音のリスナー。多くのスピーカーは、それぞれがフラットな電圧応答を持つインコヒーレントなソースを持っていると想定されています。ヘッドフォンの製造元は、これらの耳信号の生成に直接関与しています。規格に定められた要件により、フリーフィールドキャリブレーションヘッドホンが生まれました。このヘッドフォンの周波数応答は、スピーカーの前面の耳の信号を複製し、拡散フィールドキャリブレーションは、SPLを耳の中に複製することを目的としています。あらゆる方向から衝突する音のリスナー。多くのスピーカーは、それぞれがフラットな電圧応答を持つインコヒーレントなソースを持っていると想定されています。その目的は、あらゆる方向から衝突する音に対してリスナーの耳にSPLを再現することです。多くのスピーカーは、それぞれがフラットな電圧応答を持つインコヒーレントなソースを持っていると想定されています。その目的は、あらゆる方向から衝突する音に対してリスナーの耳にSPLを再現することです。多くのスピーカーは、それぞれがフラットな電圧応答を持つインコヒーレントなソースを持っていると想定されています。

ここに画像の説明を入力してください

(a)自由音場応答:より適切な参照が必要な場合、さまざまな国際規格およびその他の規格により、高忠実度ヘッドホンの次の要件が設定されています:定電圧モノ信号入力の周波数応答と知覚されるラウドネスは、無響条件下でリスナーの前にフラット応答スピーカーの。所定の周波数(0 dB基準として選択された1000 Hz)でのヘッドフォンの自由音場(FF)伝達関数は、ヘッドフォン信号が増幅されて等しいラウドネスが得られるdB単位の量に等しくなります。最小数の被験者(通常は8人)を平均化する必要があります。[...]図14.76は、一般的な許容誤差フィールドを示しています。

ここに画像の説明を入力してください

(b)拡散フィールド応答:1980年代に、拡散フィールド(DF)を基準として、自由フィールド標準要件を別の要件に置き換える動きが始まりました。結局のところ、それは標準に移行しましたが、古いものを置き換えることはありません。2つは並んでいます。FFリファレンスへの不満は、主に2 kHzピークの大きさから生じました。モノラル信号でも正面の定位は達成されないため、画像の色付けを担当しました。聴覚メカニズムが色を知覚する方法は、Theileの関連モデルによって記述されます(図14.62)。拡散場と自由場の耳の応答の比較を図14.77に示します。[...]主観的なリスニングテストが重要なテストであるため、これまでのところ、FFヘッドフォンはルールよりも例外的でした。さまざまな周波数応答の口蓋は個々の好みに応じるために利用可能であり、各メーカーはフラットから自由音場およびそれ以上に及ぶ周波数応答で独自のヘッドフォン哲学を持っています。

ここに画像の説明を入力してください

このHRTFの違いの問題は、ゼンハイザーのような企業が販売している十分な人々に対して、(ヘッドフォンで)角度を付けたドライバーがよりよく聞こえる理由でもあります。角度のあるドライバーは、ヘッドホンをスピーカーのように完全に鳴らしません。

工場または研究室では、周波数応答を測定するときに人工耳が使用されます。以下はラボレベルのものです。工場レベルのものはもう少し単純です。

ここに画像の説明を入力してください

そのHeadRoomサイトで使用されている方法見つけました

周波数応答のテスト方法:このテストを実行するには、同じ電圧で周波数が増加し続ける200トーンのシリーズでヘッドフォンを駆動します。次に、高度に専門化された(そして高価な!)ヘッドアコースティックマイクの耳を通して、各周波数で出力を測定します。その後、頭部に関連する伝達関数を削除し、表示用のデータを正確に生成する音声補正曲線を適用します。

使用されているマイクはおそらくこれです。彼らは実際にソフトウェアでダミーの頭/耳の伝達関数を反転させているようです。なぜなら彼らはその直前に「理論的には、このグラフは0dBで平坦な線であるべきだ」と言っているからです...しかし、私は彼らが何をしているのか完全にはわかりません...その後、「「自然に聞こえる」ヘッドフォンは、40Hzから500Hzの間の低音(約3または4 dB)でわずかに高いはずです」と言うからです。そして「ヘッドフォンもドライバーが耳に近づいていることを補うために高域でロールオフする必要があります。1kHzから20kHzで約8-10dBまで緩やかに傾斜したフラットラインはほぼ正しいです。」これは、HRTFの反転/削除に関する以前のステートメントとの関係で、私にはまったくコンパイルされません。

そのHeadRoomの例で使用されているヘッドフォンモデル(HD800)の製造元(Sennheiser)から入手したいくつかの証明書を見ると、HeadRoomは、ヘッドフォン自体の想定される修正モデルなしでデータを表示しているようです(これにより、ヘッドフォンの理由が説明されます)後の解釈の提案。したがって、最初の「フラットな」提案は誤解を招くものです)。一方、ゼンハイザーはDF(拡散フィールド)補正を使用するため、グラフはほぼフラットに見えます。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

ただし、これは推測にすぎません。測定機器の違い(および/またはヘッドフォンのサンプル間の違い)は、それほど大きくないため、それらの違いを十分に説明できます。


とにかく、これは活発で継続的な研究の領域です(おそらく、DFについて上記で引用した最後の文から推測したように)。一部のHK研究者によってこれがかなり行われています。私は彼らのAESの論文に(無料)アクセス権を持っていないが、いくつかのかなり広範な概要はinnerfidelityのブログで読むことができます2013年2014年と同様に、メインHK著者のブログからリンクをたどるショーンオリーブ。ショートカットとして、ここに最新の(2015年11月)プレゼンテーションからの無料のスライドがあります。これはかなりの資料です...私は簡単に見ただけですが、テーマはDFが十分ではないということです。

ここに、以前のプレゼンテーションの 1つからの興味深いスライドをいくつか示します。最初に、HD800の完全な周波数応答(12KHzに切り捨てられていない)と、より明確に開示された機器について:

ここに画像の説明を入力してください

そしておそらくOPで最も興味があるのは、ビートのベースのあるサウンドがそれほど魅力的ではないということです。

ここに画像の説明を入力してください


「それでも、実物の高忠実度で最も有望なダミーヘッドを使用したバイノーラル録音は、ヘッドフォンの再生が予定されています。放送。" 私が働いていたすべての生放送のスポーツイベントは、「ホロフォン」マイクアレイを使用して、サラウンドサウンドオーディオミックスで使用する環境音をキャプチャします。www.holophone.com
ドウェインリード

@DwayneReid:興味深い。その録音ヘッドホンの最終的なターゲットは、スピーカー付きの5.1または7.1サラウンドですか?5.1 / 7.1をヘッドフォンにダウンミックスする技術もありますが、ここではそれについては触れていません。
Fizz

まあ、彼らのメインページで宣伝されている製品は「サラウンドサウンドの個別の7.1チャンネルをキャプチャするために特別に設計された唯一の特許取得済みのマイクです」と言っている7.1から)ヘッドフォン用。
Fizz

ありがとう、この回答は非常に有益でした。要約すると、ヘッドホンの周波数応答は、顔の周りや外耳道に拡散する正面のオーディオソースから生成される歪みをエミュレートしようとしているのですが、完全にフラットな周波数応答は「不自然」に聞こえますか?
Ehryk、2015

彼らが逆変換を適用している場合、目標は再び周波数スペクトル全体にわたってフラットな0dBラインであり、理論的にはイコライザー(理想的にはプリアンプ)を介して配置できるという点で、まだ少し不明確です。アクティブなヘッドフォンメーカーがフラットな0dBカーブのポストディストーション補正を行うためにこれを行わない理由、またはおそらくSennheiser OrpheusのようにこのEQを適用する専用のヘッドフォンアンプを販売しているが、おそらく3万ドル未満?彼らはそのとき理想的なヘッドホンであるように思われます...
Ehryk '11 / 11/15

4

簡単な答えは、ドライバの応答を補正するためにオペアンプで構成されたフラットな周波数応答システムは、通過帯域で非常にフラットでない位相応答を持つ必要があるということです。この非平坦性は、トランジェント音のコンポーネント周波数が不均一に遅延することを意味し、微妙なトランジェント歪みが発生し、適切なサウンドコンポーネントの認識が妨げられます。

その結果、ひどい音がします。まるで耳の真ん中に位置するぼやけたボールからすべての音が出ているかのようです。

上記の回答のHRTF問題はこれの一部に過ぎません-もう1つは、実現可能なアナログドメイン回路は因果的時間応答しか持つことができず、ドライバーを適切に修正するには、因果的フィルターが必要です。

これは、ドライバーに適合した有限インパルス応答フィルターでデジタル的に概算できますが、これには小さな時間遅延が必要であり、映画を非常に耳障りに非同期にするのに十分です。

そして、HRTFも追加されない限り、それはまだ頭の中から来ているように聞こえます。

結局のところ、それほど単純ではありません。

「透明な」システムを作成するには、人間の聴力範囲全体でフラットな通過帯域が必要なだけでなく、線形位相も必要です-フラットな群遅延プロット-そして、この線形位相が必要であることを示唆する証拠がいくつかあります驚くほど高い周波数まで継続して、方向の合図が失われないようにします。

これは実験で簡単に確認できます。Audacityやsndなどのサウンドファイルエディタで、使い慣れた音楽の.wavを開いて、1つのチャンネルから1つの44100 Hzサンプルを削除し、もう1つのチャンネルを再調整して、最初のチャンネルをサンプルは編集されたチャンネルの2番目のチャンネルで発生し、再生します。

1/4の100分の1秒の時間遅延であるにもかかわらず、非常に顕著な違いが聞こえます。

これを考慮してください:音は約340 mm / msになるため、20 kHzでは、これはプラスマイナス1サンプル遅延の時間誤差、つまり50マイクロ秒です。それは17 mmの音の移動ですが、欠けている22.67マイクロ秒との違いを聞くことができます。これはわずか7.7 mmの音の移動です。

人間の聴覚の絶対カットオフは一般に約20 kHzと見なされているので、何が起こっているのでしょうか。

その答えは、聴覚テストは、テストの各部分でかなり長い間、ほとんど一度に1つの周波数のみで構成されるテストトーンで行われるということです。しかし、私たちの内耳は、ニューロンをそれにさらしながら音に一種のFFTを実行する物理構造で構成されているため、異なる位置にあるニューロンは異なる周波数に相関します。

個々のニューロンは非常に速く再起動することができるだけなので、いくつかのケースでは、いくつかが次々と使用され続けます...しかし、これは約4 kHz程度までしか機能しません...トーンの知覚は終わります。それでも、脳が非常に傾いていると感じたときにいつでもニューロンの発火を停止するものは何もないので、重要な最も高い周波数は何ですか?

重要なのは、耳の間の小さな位相差は認識できるということですが、音の識別方法を(スペクトログラフィック構造によって)変更するのではなく、音の方向の知覚方法に影響を与えます。(HRTFも変更されます!)聞こえる範囲から「ロールオフ」する必要があるようですが。

答えは、-3dBまたは-10dBポイントでもまだ低すぎるということです。すべてを取得するには、約-80 dBポイントに移動する必要があります。大きな音だけでなく静かな音も処理したい場合は、-100 dBを下回らないようにする必要があります。主にそのような周波数が鋭い過渡音の一部として他の高調波と同相で到着したときにのみ「カウント」されるため、どのシングルトーンリスニングテストがこれまで見られることはほとんどありません。個々の周波数成分が孤立しているため、それらが小さすぎてカウントできない場合でも、神経応答をトリガーします。

もう1つの問題は、とにかく多くの超音波ノイズ源に絶えず衝撃を受けていることです。おそらくその多くは、自分の内耳の壊れたニューロンからのものであり、以前のある時点での過度のサウンドレベルによって損傷を受けています。そのような大きな「ローカル」ノイズでのリスニングテストの孤立した出力トーンを見分けるのは難しいでしょう。

したがって、システムの前に人間のローパスがフェードアウトするためのスペースがあるように(これは、脳がすでに「キャリブレーション」されている独自の位相変調により)、「透過的な」システム設計ではるかに高いローパス周波数を使用する必要があります。位相変調はトランジェントの形状を変化させ始め、それらを時間内にシフトさせて、脳がそれらがどのサウンドに属しているか認識できないようにします。

ヘッドフォンを使用すると、十分な帯域幅を備えた単一のブロードバンドドライバーを持つように単純に構築し、「未補正」ドライバーの非常に高い固有周波数応答に依存して一時的な歪みを防ぐのがはるかに簡単です。ドライバーの小さな質量がこの状態に適しているので、これはイヤホンではるかにうまく機能します。

位相の直線性が必要な理由は、時間領域の周波数領域の双対性に深く根ざしています。これは、実際の物理システムを「完全に補正」できるゼロ遅延フィルターを構築できないためです。

重要なのは「位相の直線性」であり、「位相の平坦性」ではない理由は、位相曲線の全体的な傾きが問題にならないためです。双対性により、どの位相の傾きも一定の時間遅延と同等です。

すべての人の外耳の形状が異なるため、わずかに異なる周波数で異なる伝達関数が発生します。あなたの脳は、それが持っているものに慣れており、それ自身の明確な共鳴があります。間違ったものを使用すると、実際に悪いことに聞こえます。これは、脳が慣れている修正がイヤホンの伝達関数の修正に対応しなくなり、共鳴がキャンセルされないことよりも悪いことになります- 2倍の数の不平衡ポール/ゼロが位相遅延を乱雑にし、グループ遅延とコンポーネントの到着時間の関係を完全に乱雑にします。

それは非常に不明瞭に聞こえるでしょう、そしてあなたは録音によってエンコードされた空間的イメージングを作ることができなくなります。

ブラインドA / Bリスニングテストを行う場合、少なくともグループ遅延をあまり損なわない未補正のヘッドフォンを誰もが選択するので、脳は自分自身に再調整できます。

そしてこれこそが、アクティブなヘッドフォンがイコライズしようとしない理由です。正しく理解するのは難しいです。

デジタルルーム補正がニッチである理由もここにあります。適切に使用するには頻繁な測定が必要であり、ライブで行うのは困難/不可能であり、一般に消費者は知りたくないのです。

主に低音応答の一部である修正中の部屋の音響共鳴は、気圧、温度、湿度がすべて変化するにつれてわずかにシフトし続け、それによって音速がわずかに変化し、それによって共鳴がそれらから離れるように変化するためです測定が行われたときでした。


Fドミアンでのフィルタリングは、位相の歪みを引き起こします。すべてのパスの位相イコライゼーションを使用して、これを相殺できます。IN理論のデジタルまたはアナログは、良好な位相を持つことができます。デジタルは最近の柔軟性が向上しています。
2015年

あ、ありがとう。これにより、アナログ信号が渡されるアクティブなヘッドホン(有線ヘッドホン)でそれが行われない理由が明らかになります。これにより、ソース(コンピューターや電話など)でデジタル的に、またはワイヤレスヘッドフォンでデジタル的に遅延なく位相歪みなしでレベルをリアルタイムで調整できる可能性が残されているようです。これは、「完全にフラット」な(HRTF後の)応答の実現可能性としてまだオープンですか?
Ehryk 2015年

いいえ。多少の遅延が発生しているはずです。それ以外の場合は、遅延を追加せずに実際の(因果的)システムの位相を修正する唯一の方法は、正確に逆の因果的時間応答を持つフィルターを使用することになるため、文字通りタイムマシンが必要です。そして、それは必ずしもそれは時間= 0で着地する前に、信号の「未来」を知る必要があり、この手段
RGD2

-1

興味深い記事と議論。ナイキストの定理はあらゆる場所に適用されるルールであると考える傾向があり、その場合は適用されないことがわかります。人間の聴覚の限界を正弦波を使用して20kHzまで測定し、耳から聞こえるすべてのものをキャプチャしたという確信を持って44.1または48 kHzでサンプリングします。しかし、1つのチャネルを1つのサンプルだけシフトすると、一時的に20kHzを超える差がありますが、大きな変化が起こります。

動画では、目は1秒あたり20フレームを超えるフレームレートの画像を統合していると考えられます。したがって、フィルムは24fpsで撮影され、2xシャッターで再生されてフリッカー(48fps)を低減します。テレビは、地域に応じて50または60 Hzのフレームレートです。特に60 Hzで成長した場合、50 Hzのフレームレートのちらつきを目にする人もいます。しかし、ここが興味深いところです。過去数年にわたるハリウッドプロフェッショナルアソシエーションテックリトリートおよびSMPTEカンファレンスでは、ネイティブフレームが60 Hzから120 Hzに拡張されると、平均的な視聴者の品質が大幅に向上することが示されています。さらに驚くべきことに、フレームレートを120 Hzから240 Hzに上げると、同じ視聴者でも同様の改善が見られました。ナイキストは、フレームレートが24で表示されない場合、フレームレートを2倍にするだけで、目が解決できるすべてのものがキャプチャされます。しかし、ここではフレームレートの10倍であり、顕著な違いが見られます。

明らかに、ここではさらに多くのことが行われています。モーションイメージングの場合、画像内のモーションが必要なフレームレートに影響を与えます。オーディオでは、サウンドスケープの複雑さと密度が必要なオーディオ解像度を決定することを期待します。これらの音はすべて、イメージングに必要なアーティキュレーションを提供するために、周波数応答よりも位相コヒーレンスに大きく依存しています。


ここで質問に答えるものは何も見つかりません。サンプルレートとナイキストのサンプリング定理は、ヘッドフォンのイコライゼーションとどのような関係がありますか?
パイプ

人間にはADCはありません。人間の聴覚/視覚は何も「サンプリング」せず、アナログとデジタルの一種の混合であり、実質的に連続しているニューロンを使用します。耳には物理的なカットオフがあります。視覚の知覚は、脳が情報を処理する速度によっても制限されます。
電圧スパイク
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.