2
ステレオ音声信号からボーカル部分を抽出する方法は?
現在MP3ファイルを処理していますが、この問題が発生します。私のMP3はステレオでエンコードされています。私がやりたいのは、さらに処理するためにボーカル部分を抽出することです(出力信号のモードがモノでもステレオでも問題ありません)。 私の知る限り、オーディオはMP3の異なる独立したサブ周波数帯域にエンコードされます。カットオフ周波数を適切に設定したハイパス/ローパスフィルターを使用して、ボーカル範囲に信号を制限できると思います。ただし、この場合、結果には純粋な音楽信号の一部が含まれている必要があります。またはグーグルの後、最初にバックグラウンド信号を計算するかもしれません(ボーカル部分が位相キャンセルと呼ばれるステレオオーディオの中心にあると仮定して、1つのチャンネルを他のチャンネルからの信号に追加することによって反転します)。この変換後、信号はモノになります。次に、元のステレオをモノラルにマージして、そこから背景信号を抽出します。 有効性を考えると、どちらが好まれますか(または他のソリューション:)?2番目のチャネルの場合、2つのチャネルAとBを使用して、バックグラウンドを計算するときに(BA)または(AB)を使用しますか?2つのチャネルをマージする場合と同様に、算術平均は十分に正確ですか?または、各チャネルを2倍にダウンサンプリングし、ダウンサンプリングされた信号をモノラルの結果としてインターリーブできますか? よろしくお願いします。