時間と周波数以外のドメインでオーディオ信号を表すことはできますか?


8

馬鹿げた質問かもしれませんが、オーディオ信号の時間領域表現と周波数領域がある場合、信号を表現できる他の領域はありますか?


3
ケプストラムは、一部のアプリケーションで非常に役立ちます。
セルジュ

回答:


8

オーディオは実際には時間領域にのみ存在します。オーディオでは、それが正弦波の和に変換されます。これは、音の聞こえ方に関連しているためです。サウンドを解釈する方法は他にもありますが、その表現があなたにとって有用かどうかは、そのすべてに依存します。ウェーブレット、グラニュラーシンセシス、フォルマントシンセシスなど、興味があると思うかもしれませんが、サウンドを一種のグラニュラーシンセシスで表現することで機能するものについて読んだことを覚えています。


13

基本的には、情報をいくつかの「ビット」に分解することがすべてです。実際のオーディオ信号は、時間によって変化する「値」ですが、多くの場合、それを別の形式で検討すると便利です。類推として、数値を考えてみ256ましょう。数値をどのように処理しているかに応じて、数値を200 + 50 + 6、または16 + 240、または16*16、またはのように扱うと便利です2^8。数を処理する方法は無数にあり、どの方法を使用するかは、達成しようとしていることに依存します。

「周波数領域表現」は、上記の内訳を行う例ですが、数値ではなく信号を使用しています。この場合、元の信号を、すべて異なる周波数、振幅、位相の正弦波の合計として表します。それらをすべて一緒に追加すると、元の信号が返されます。別の方法でそれを表すことを選択することもできます。たとえば、ウェーブレットや、名前に(まだ)付けられている場合と付けられていない場合の方法で、それが目的に対して役立つ場合です。たぶん、それを3秒のチャンクに分割し、それらのチャンクのそれぞれで信号を並べ替えて単調増加し、それらをどのように並べ替えたか覚えているかもしれません。これは少しばかげているように聞こえますが、このような並べ替えでMRI画像を操作する方法があります(チャンク部分は使用しませんが、

正弦波の利点の1つは、ネイサンデイが言うように、耳が音のピッチを解釈する方法に関連していることです。しかし、さらに重要な理由は、正弦波が線形システムの固有関数である複素指数であることです。つまり、入力と出力を正弦波の和と見なすと、線形システムの方が分析がはるかに簡単になります。これが、フーリエ解析が広く普及し、重要である主な理由です。

あなたの質問への短い答え:オーディオ信号を表すことができるドメインの数は無限です。別の人気のドメインについては、ウェーブレットを参照してください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.