音楽にはどのような技術仕様を設定する必要がありますか?


11

私はビデオゲームの音楽を書いています。ある時点で、プログラマーと協力して、渡すオーディオファイルの技術仕様を決定する必要があります。どのような詳細について話す必要がありますか?

たとえば、解決する必要があると思われるいくつかの質問は次のとおりです。

  • オーディオファイルはどの形式にする必要がありますか?
    • 非圧縮?無損失の?圧縮?
    • 高品質のオーディオと小さなファイルサイズのバランスはどのくらいですか?
  • 音楽の音量はどうですか?
    • 各トラックの平均音量レベルはどうあるべきですか?
    • 最も大きな音量レベルは何ですか?
  • 度数分布はどうあるべきですか?
    • たとえば、低音の少ないフォーリーが簡単に聞こえるように、低音の少ない音楽を書くようにすべきでしょうか?

重要だと思った質問はありますか?議論すべき他の質問はありますか?


これは非常に広いようです...

5
他の人にとって有用なリソースになるので、すばらしい質問だと思います。
エンジニア

2
頭に浮かぶのは、音の優先度です。これはDiabloのようなゲームでかなり明白で、スピーカーにすべての衝撃を与えると同時に多くのエフェクトが発生します。たくさんのアクションが起こっているときにノイズになることを避けるために、足音やアンビエントなどのそれほど重要でない音のいくつかを調整して、キースペルなどの重要な音をプレーヤーが気付くように反応させる必要があるようにする必要があります。戦いがかなりダウンしたら、それらのボリューム。また、使用できるチャネルの数はハードウェア機能によって異なります。
ScrambledRK

回答:


6

私が正しく理解していれば、ここに2つの異なる質問があります。

  1. (プログラミングの場合と同様に)どのような技術的な考慮事項を設定する必要がありますか?

  2. (オーディオエンジニアリングの場合と同様に)どのような技術的な考慮事項を設定する必要がありますか?

どちらの場合も、担当者にお尋ねください。前者の場合、それはリードオーディオプログラマーである可能性があり、後者の場合、それはオーディオディレクターである可能性があります。

さて、あなたはここでこれを尋ねているので、あなたはそのような役割のない小さなチームにいると思います、そしてあなたのプログラマーはおそらくあなたが話していることを知らないので、私はいくつかの一般的に答えますほとんどのプロジェクトで機能するガイドライン。しかし、いずれにせよ、私は自分で決断することをお勧めしません。他のチームメンバーと話し合って結論を出します。

とはいえ、まず技術的な(プログラミング)考慮事項について話しましょう。

  • 通常、オーディオファイルが配布される形式は、使用しているプラ​​ットフォームまたはゲームエンジンによって既に決定されています。マルチプラットフォームを使用する場合は、各プラットフォームに完全に独立したリソースディレクトリがあり、オーディオファイルの特性はプラットフォームごとに異なる可能性があります。

    たとえば、AndroidではOgg Vorbisファイル、iOSではMP3またはAAC、WindowsではWMAを提出する必要がある場合があります。

    時々、フォーマットさえ各ファイルの目的に依存しています。iOSはあらゆる目的でMP3およびAACファイルを適切に再生しますが、PlayStation MobileはBGMにMP3を必要としますが、非圧縮PCMまたはMicrosoft ADPCMのみをサポートします。

    プログラマーに、ファイルの形式を尋ねる必要があります。

  • ほとんどの場合、ファイルの基本仕様はすでに定義されているので、プログラマーにこれについて尋ねてください。たとえば、BGMファイルは通常ステレオで配布されますが、SFXおよび音声ファイルは通常モノで配布されます(したがって、ゲーム内に簡単に配置できます)。

  • ビットレートやその他のパラメータについても、これらは通常、エンジンまたはプラットフォームに依存しています。ここにある程度の自由がある場合、サウンドデータは通常ゲームの最大のコンポーネントであることを考慮してください。ゲームをデジタルダウンロード経由で配布する場合、プログラマ(および顧客)は、ファイルを小さくするかどうかを感謝しますできるだけ。

    物理メディアで配布する場合は、最大配布サイズが事前に決定されており、残りのコンテンツ作成チームと真剣に交渉する必要があります。

  • 一部のゲームでは、サウンド(主にBGM)をループ可能にする必要があります。他のゲームでは、サウンドに厳密なタイミング制約が必要です(リズムゲームなど)。ほとんどの非可逆圧縮方式では、トラックの最初と最後にパディングサイレンスが追加され、ループと厳密なタイミングが壊れる可能性があります。これらの問題についてプログラマと話し合ってください。

オーディオを圧縮する方法は多すぎるため、各サウンドファイルのマスターバージョンを44.1KHz 16ビットステレオの非圧縮PCMで出力し、そのファイルを使用して各プラットフォームの実際のファイルを作成することをお勧めします。(最適には、マスターファイルに小さな変更を加えるたびに各ファイルを再変換する必要がないように、各ファイルに適用できる変換スクリプトを作成できます)。

さて、技術的な観点(オーディオエンジニアリングの場合など)に関しては、プログラマーはほとんど気にしないでしょう。そのため、この領域でより多くの自由度があります。プログラマーの生活を楽にするためにできることはいくつかあります。

  • ゲーム内のすべてのサウンドは、ラウドネスを正規化する必要があります。少なくとも、すべてのBGMファイルの音量は同じであり、すべてのSFXファイルの音量は同じである必要があります。プログラマがコード内のボリュームを微調整する必要がないようにしてください。

  • 再生コードは非常に制限されており、通常は線形増幅しか実行できません。このため、再生中の音量を下げると通常は音量を上げるよりも良い結果が得られるため、高音量と低音量の間で高音量が好ましい場合があります。正確なラウドネスを正確に言うことは困難ですが、経験則として、全体的なピークツーピークの振幅が大きいほど、サンプリング範囲をより適切に使用できます。

    他のゲームをロードして、それらのサウンドを最大音量設定で再生し、自分のサウンドを他のゲームと比較したい場合があります。

  • イコライゼーションに関しては、これは実際にはゲームの他のサウンドに依存すると言えます。これについてサウンドディレクタと話し合うだけでなく、使用する再生ハードウェアも考慮する必要があります。デスクトップコンピュータにはさまざまな再生ハードウェアがあり、ハンドヘルドデバイスには通常、非常に小さなスピーカーがあり、それを補います。アーケードマシンには通常、さまざまな要件があります。


指摘すべきことが1つあります。SFXの場合、ステレオファイルが嫌いです。それらをエンジンでモノラルに組み合わせて、3Dサウンドエンジンに適切に配置できるようにする必要があります。結果として、すべてがオリジナルのSFXになる場合があります。たとえば、フォーリーサウンドはモノラルです。
rioki 14

2

私は2つの状況を区別します。つまり、開発中およびその後(保管)に保持するものと、最終的な配信に入れたものです。

ストレージには、可能な限り最高の品質を使用します。つまり、オーディオの場合、ロスレスのあるフォーマットです。圧縮がロスレスである限り、それは本当に重要ではありません。WAVまたはFLACで十分です。基本的には44.1 kHz / 16ビットの録音で大丈夫です。音量は可能な限り「自然」である必要があります。したがって、必要に応じて基本的に最小限のゲインでオリジナルの録音を行います。(本当に必要な場合は、96 kHzまたは192 kHzのレコーディングを使用できます。)サイズはそれほど重要ではありません。ハードディスクはそれほど高価ではなく、その問題でいつでもより多くを投げることができます。主な根拠は、損失のない形式から損失のある形式にいつでも圧縮できることですが、いったん損失のあるファイルしかないと、高品質に移行することはできません。

それはまったく別の話です。ここでは、品質、空間、速度の厳格な選択を行う必要があります。小さいSFXの場合、ロードが最も速いWAVファイルを使用します。一方、音楽のサイズは重要なので、通常は可変ビットレートのMP3を使用します。64 kbpsのファイルでも問題はありませんが、それは好みの問題です。サウンドはお互いにバランスが取れていますが、基本的には自然な音量である必要があります。ゲームエンジンは、特に3Dサウンドなどを実行している場合は特に、必要に応じて調整を行います。


44.1KHz 16ビットステレオの非圧縮PCMが約1300kbpsになることをご存知ですか?320kbpsの非圧縮オーディオは恐ろしく聞こえます。
パンダパジャマ

確かに、私は主に圧縮オーディオについて言及していました。128kbps FLACサウンドは非常に良好です。
rioki 14

エンコーダー設定としての「kbps」は、FLACまたはその他のロスレスエンコーダーには意味がありません。サイズ対(サウンド)品質は、不可逆圧縮でのみ意味があります。それがあなたが話しているFLACだと確信していますか?
パンダパジャマ2014

あなたは正しい、それはプログラマーが話していることです。「ビットレート」は元の記録に基づいています。通常は44 kHzで十分です。あなたは肛門を得て、96kHzまたは192kHzの録音を行うことができます。私は本当の意味を変更します...
rioki

1
44KHz、96KHz、192KHzは「サンプリングレート」であり、「ビットレート」ではありません。それらを混同させるのは良い考えではありませんsampling rate * sample size * channel count = bitrate。そのため、44.1KHz 16ビットステレオのビットレートは正確に1411200ビット/秒です。320kbpsの16ビットステレオサウンドは10KHzでサンプリングする必要があるため、私の「恐ろしく聞こえる」という発言。
パンダパジャマ2014
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.