線形予測コーディング(LPC)の背後にある理論


9
  • LPCの背後にある理論は何ですか?
  • LPCの特定の実装が、他の圧縮音声符号化方式よりも伝送または符号化エラーの量子化に対してより耐性があると言われているのはなぜですか?

  • LPCメソッドは、カルマンフィルターメソッドの使用と同様に、平滑化または短期の "予測"にも使用できますか?

  • LPCの使用はどのような条件または制約の下で有効ですか?

「LPCが他のいくつかの圧縮された音声エンコーディングスキームよりも伝送またはエンコーディングエラーに対してより耐性があると言われたのはなぜですか?」誰が言った?LPCについてはよく知りませんが、冗長性を削減することと関係があると思いました。これは逆の効果をもたらします。
内部石

この質問は誤った前提にあるため、誤解を招く可能性があります。これを閉じて修正してください。
Dipan Mehta

ここには複数の質問と前提があります。どれが修理が必要だと思いますか?
hotpaw2

1
ステートメントWhy are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?はかなり間違っています。他の何よりも優れていることを具体的に示す参考文献を引用できますか?
Dipan Mehta、2012

1
それが実は私の質問です。私はどこかでこれを聞いたが、なぜこれが述べられたのかわからない。
hotpaw2

回答:


14

まず、線形予測コーディング(LPC)が「送信またはエンコーディングエラーに対してより耐性がある」と言うことは、完全に真実ではありません。係数が送信される形式は、大きな違いをもたらします。たとえば、線形予測係数が解決される場合、高次IIRフィルター係数と同様に、量子化に対して非常に敏感になります(これは、合成フィルターがIIRになるためですが、後で詳しく説明します)。ただし、他の形式で送信される場合、この問題は簡単に軽減できます。

1つの方法は、反射係数を転送することです。k次の線形予測フィルターを再帰的に解く場合、各ステージの最高次の係数は反射係数と呼ばれます。これらは、システムを完全に特徴付けるために一緒に使用できます(これは、レビンソン再帰から簡単に見ることができます)。実際、それらすべてを一緒に使用してラティスフィルターを形成できます。これらのフィルターは、低ビット数に対してはるかに堅牢であるため、量子化が懸念される場合によく使用されます。さらに、これらの反射係数の大きさが1で制限されている場合、信号を合成するためにフィルターが使用されるLPCにとって重要なBIBO安定フィルターが保証されます。頻繁に使用されるラインスペクトルペアなどの他の方法がありますが、

ここで、最初の質問に対処するために、LPCの理論は声道モデリングを中心に展開します。基本的に、私たちは音声をある構造のチューブへの入力として空気振動としてモデル化しています。このモデルを具体化するために、より詳細なリソース(チューブの長さ、空気の強度、構造など)を探すことができます。これらのリソースは、これらの構造を、ホワイトノイズなどのさまざまな刺激に応答するIIRフィルターに直接関連付けます。

したがって、線形予測係数を解決するときは、信号(たとえば音声)を係数から作成されたFIRフィルターに入力すると、出力としてホワイトノイズが得られるような係数を探します。それが何を意味するか考えてください。高度に入力しています相関信号、およびホワイトノイズシーケンスの出力。したがって、実際には、その信号の線形依存性をすべて削除しています。これを見る別の方法は、重要な情報のすべてが、この線形依存を取り除く係数に含まれていることです。したがって、これらの係数(または上記の何らかの形式)を転送し、受信側で信号を再作成できます。これを行うには、線形予測FIRフィルターを反転させてIIRフィルターを作成し、ホワイトノイズを入力します。したがって、圧縮は、この線形依存関係を削除し、係数を転送することから行われます。これが、線形予測フィルターの出力ノイズの「ランダムさ」または白色度を最大化することを目的としているため、Burg法が最大エントロピー法とも呼ばれる理由です。これを見る別の方法は、

あなたの最後の質問に答えるために、あなたが完全に何を求めているのかわかりません。LPC、または線形予測コーディングは、前述のように信号を効率的にモデル化できると想定して信号を「圧縮」することを意味します。あなたが言及したように、あなたは確かに「短期予測」を行うために線形予測を使うことができます。これは、パワースペクトル密度推定に使用される高解像度AR手法の背後にある暗黙の基礎です。自己相関シーケンスは、有限なデータレコードから、有限なデータレコードから無限に、ウィンドウ化されていないシーケンスの理論的な自己相関シーケンスとして再帰的に拡張できます。これは、PSD推定のAR手法がサイドローブ現象を示さない理由でもあります。


1
「LPCの理論は声道モデリングを中心に展開します」これは常に正しいですか?FLACは、音声だけでなく、一般的なオーディオ波形でLPCを使用します。
内部石

3
申し訳ありませんが、もともとは声帯の物理モデルとしてのアナロジーで学んでいます。私が言ったように、彼らがこれをさらに深く掘り下げるところがあります。LPCは一般的なオーディオ波形に適しています。私が述べたように、それはどんな衝動的なスペクトルでもうまく働きます。当然の結果として、それはスペクトルが衝動的ではないノイズの多い信号ではうまく機能しません(これは、ノイズの多い信号がARMAプロセスとしてより適切にモデル化されているためです)。
ブライアン
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.