プレーヤーが気付くまでの最大オーディオ遅延は？

38

ゲームで何らかのイベントが発生した場合、プレーヤーがオーディオをそのイベントに適切に関連付ける（遅延を認識しない）オーディオ生成の最大遅延はどれくらいですか？

audio

あまりない。私はそれが1/10秒未満でなければならないと思います。個人的には、60 FPSで数フレーム以上の場合は気づくかもしれません。

— アルモ

ほとんどの場合、レンダリングされた出力にも多少の遅延があり、その一部はモニターからのものであることを忘れないでください。プレーヤーの入力結果が画面に表示されるまでに100ミリ秒以上かかる場合があります。参照してくださいanandtech.com/show/2803

— アダム

1

楽器を演奏する場合は約20ミリ秒、リスナーの場合は約80ミリ秒です。これは私の個人的な経験であり、走行距離は異なる場合があります。

— rwols

一貫性が必要な特定の時間以上。すべてが同じ遅延を持っている限り、あなたは理にかなっています。すべてが100ミリ秒遅れている場合、実際には気付かないかもしれませんが、いくつかの音がほぼ瞬時で、残りが100ミリ秒またはその間にある場合、気づくでしょう。

— 0xFADE

何らかの現実的な振る舞いに何らかの形で興味があるなら、リスナーから遠く離れたイベントの遅延を何か良いものと考えることができます。

— ダークウィングス

48

以下の結果は、「最も顕著なa / v同期エラー」とみなされるリップ同期について計算されます。

ウィキペディアによると

テレビアプリケーションの場合、オーディオはビデオを15ミリ秒以内にリードし、オーディオはビデオを45ミリ秒以内に遅らせる必要があります。フィルムの場合、許容できるリップシンクは、どちらの方向でも22ミリ秒以下と見なされます。

Media and Acoustics Perception Labによると

実験の結果、a / v同期検出の平均オーディオ先行しきい値は185.19ミリ秒であり、標準偏差は42.32ミリ秒であることが判明しました。

ATSCによると

一見緩いように見えます：「許容範囲のウィンドウ」として+90ミリ秒から-185ミリ秒

そして

-100ミリ秒から+25ミリ秒まで検出不可

-125 msおよび+45 msで検出可能

-185ミリ秒および+90ミリ秒で受け入れられなくなる

（–サウンド遅延、+サウンドアドバンス）

結論する

結果はそれほど遠くありません。最大許容遅延は約150ミリ秒で、60フレーム/秒で9フレームであるようです。

— ヘッケル
ソース

3

「遅延がある場合、遅延しているのはビデオでなければなりません。」ATSCの記事には、視界の少し後に音が発生することを人々が期待/許容していると明確に述べられていますが（実際の音は距離1フィートあたり約1ミリ秒遅れています）、イベントを適切に関連付けないでくださいビデオイベントがサウンドの後に発生する場合。

— ペティス

あなたは正しいです、私は完全に誤解しました。ありがとうございました。（編集）

— ヘッケル

1

私は個人的な経験から、これは同じ人の耳間でも異なることを伝えることができます。まれに前庭があり、実際に脳が左耳の聴覚刺激を処理し、右耳よりもかなり遅れています。悪い日にこれはめまいを引き起こしますが、ほとんどの場合それは許容できます。はい、これは非常に主観的です。

— アンドンM.コールマン

どこで150msを取得しますか？ソースは明らかに平均で約45ミリ秒です。

— マイルルーティング

ウィキペディアでは45msと書かれていますが、必ずしも最も信頼できるソースではありません。2番目のソースは185.19ミリ秒、3番目は125ミリ秒とわかります。私が間違っている場所を理解するのに役立つソースを引用できますか？

— ヘッケル

9

イベントによります

たとえば、あなたが見たり聞いたりする爆発は、単一のイベントであると感じ、他の回答で説明されている許容値を持ちます。最大50msです。一部の人々はより敏感かもしれません（ミュージシャンなど）ので、30msまたは60fpsで2フレーム以下を目指すことをお勧めします。

私は、知覚距離がこれらの許容範囲に影響を与えると考えています。実際の生活では、音は距離の各フィートあたり約1ms遅れるので、人々は遠くの音がわずかに遅れることを期待しています。そのため、ズームアウトされたRTSゲームの「マップ」の爆発は、FPSで自分の銃を発射するプレイヤーよりも音の遅れに対する許容度が大きくなる可能性があります。

音楽/リズムゲームに適切な感触があるなどの特殊なケースでは、15〜20ミリ秒またはそれ以下の厳しい許容誤差が必要になる場合があります。たとえば、マイクに向かって歌ったり、プラスチック製の楽器、および同じイベントに対してシステムによって生成されたサウンドの場合、50ミリ秒の遅延により、「オリジナル」と「再生」のサウンドが奇妙に混ざります。

さらに、オーディオファイルの開始とそのオーディオファイル内の「イベント」との間の遅れに注意してください。多くのオーディオクリップでは、「イベント」が端に正しくないため、雷の音がすることがあります開始から200ms後に「ストライク」が発生するストライクは誰にとっても明らかであり、ほとんどすべてのサウンドファイル（ドラムヒットであっても）には遅延があります。

平均を測定しないでください-最悪の場合を見てください

視力と聴覚は人間の知覚に深く関係しており、そのうちの1つが他の音と比べてst音がする場合、知覚されます。ほとんどの場合、非常に高速ですが、ロード中に0.2秒の遅延が発生することはありません。人々はそのような状況に気付くでしょう。これが、オーディオがしばしば別のスレッドで実行され続け、他のアクティビティから隔離され、プリロードされたクリップが再生されるべきであるという迅速な通知を得る理由です。

— ペテリス
ソース

5

プレーヤーが音を発生させる状況（音楽ゲーム、FPSの銃）は、プレーヤーがその瞬間にそれを実現するためにインパルスを送信しているため、非常に低い遅延が必要になります。非常に小さな遅延の。サウンドエンジニアは、「グルーブ」を台無しにする5ミリ秒未満の録音遅延について心配しています。

Journal of the American Academy of Audiologyでは、人々（ミュージシャンだけでなく）が遅れて自分の声を聞いているとき、3ミリ秒という短い遅延を認識しており、10ミリ秒を超える遅延は90％の時間に不快であると述べています。

人間は、方向情報のために耳と耳の間の時間遅延を使用するため、1mSec未満の遅延から情報を処理および抽出できる必要があります。

上記の185.19ミリ秒は、主要なサウンドエラーを指しているので、とにかく、ゲームに積極的に関与せず、映画を受動的に見るときに受け入れられるものを指しているため、無関係です。

— SamB
ソース

4

ここで受け入れられている回答は、主に受動的にビデオを視聴する際のオーディオ同期の知覚について説明しています。これらの場合、視聴者は、ビデオ内のはっきりとした兆候に注意を向けない限り、オーディオを再生すべき正確なタイミングを簡単に特定することはできません。これは、彼らが音に対する期待を制限していることを意味します。

ゲームには、この低予想仮説が当てはまらない2つの重要なケースがあります。

プレーヤー自身がサウンドを発生させたとき（SamBが指摘しているように）、ボタンを押す意図を形成した瞬間から、サウンドをいつ聞くかを正確に知っています。
音楽ゲームやカチカチと音を立てるタイマー/カウンターを備えたもののように、音が周期的なビートに着地することになっている場合、このリズムにより、プレーヤーは次の音を予測し、時間切れになった場合に気付くことができます。

GDC 2013のこの講演では、Mathieu Pavageauが、プレイヤーが約5 ミリ秒を超える同期精度の違いを認識できると主張しています。リップシンチングの例が示すよりもはるかに寛容です。「Time Perceptionの例」と「Ubisoftゲームの例」のセクションを確認して、自分で聞いてください。Rayman Originsメニューは、16ミリ秒（ビデオフレーム）以内に同期した場合、それ自体が「遅延」しているようには聞こえませんが、5ミリ秒以内に同期した場合、著しく良く、よりタイトに聞こえます。

Pavageauは、低レベルのオーディオコールバックを使用して、この種類のタイトでリズミカルなゲームプレイが必要な場合、この種のサブフレームの精度を獲得することを提唱しています。

— DMGregory
ソース

2

人がオーディオキューに反応する必要があるゲームの場合、音が遅れるミリ秒ごとに、人の応答も同様に遅れます。単に映画やカットシーンを見ている人は、オーディオとビデオが正確に同期していない場合、あまり気づかないかもしれませんが、多くの場合、オーディオがプレーヤーの動作と同期していることが重要であり、時には重要です。

— スーパーキャット
ソース

-1

理論的には、50msを超えるものはすべて写真との関連で顕著になります。25msで音とその遅延を2つの別々の音として聞くことができるため、50ms未満にとどまることを強くお勧めします。 5ミリ秒から15ミリ秒の範囲に留まることもできます。

これがお役に立てば幸いです！

https://en.wikipedia.org/wiki/Delayed_Auditory_Feedback

— X-Raysounds
ソース

この回答は、既存の回答にまだ存在しない新しいアドバイスを追加するものではないため、会社の連絡先情報の単なるプラグまたは広告として脱落する危険があります。StackExchangeはサービスを宣伝することを目的としていないため、その部分を削除することをお勧めします（ユーザーはユーザー名で引き続き検索できます）。

— DMGregory

私たちが見た答えは私たちにとって正しいものではなく、私たちはサウンドエンジニアのチームであり、音響学は私たちが最初に学んだことです。いくつかの答えは100ミリ秒以上と言っていました。-50msまたは+ 50msでも、アクションとサウンドの差は50msです。メールの送信が不快な場合にのみ削除するようにしています。

— X-Raysounds

たとえば、3年前のPeterisの回答を参照してください。これは、同じ絶対上限50 msを提供し、この回答と同じ下限を推奨します。推奨事項を拡張したい場合を除き、それはこの回答に含まれているものの全範囲をカバーしているようですか？たとえば、ウィキペディアのリンクに関連性があると思われる詳細がある場合は、少なくともそれらを回答のテキストに要約することをお勧めします（リンクされたページが将来変更される場合に備えて）。

— DMGregory

申し訳ありませんが、いくつかの回答をすべてスキップし、ウィキペディアのリンクでそれを知って強制しました、私たちはまだフォーラムの初心者であり、サウンドに関するいくつかのヘルプを提供しようとしています関連する問題がありますが、多くの

— 母

心配ない。これらのコメントが存在する理由の1つは、新しいユーザーをコーチングすることです。:) StackExchangeの回答はすぐにハングアップします。フォーラムの返信ではなく、長期的な参照リソースとして考えることを意味します。

— DMGregory