回答:
DCTとPCA(より正確には、相関行列の固有ベクトルによって形成される基底のデータセットを表す-Karhunen Loeve変換としても知られている)の主な違いは、PCAは特定のデータセット(相関行列は推定されます)、DCTは「絶対」であり、入力サイズによってのみ定義されます。これにより、PCTは「適応」変換になりますが、DCTはデータに依存しません。
PCAがその適応性のために、画像または音声の圧縮でより頻繁に使用されない理由を疑問に思うかもしれません。2つの理由があります。
エンコーダがデータセットのPCAを計算し、係数をエンコードするとします。データセットを再構築するには、デコーダーには係数自体だけでなく、変換行列も必要になります(アクセスできないデータに依存します!)。DCTまたはその他のデータに依存しない変換は、入力データの統計的依存性を除去する効率が低い場合がありますが、変換行列は、送信する必要なしにコーダーとデコーダーの両方で事前に知られています。サイド情報をほとんど必要としない「十分な」変換は、サイド情報の追加負荷を必要とする最適な変換よりも優れている場合があります...
これらのタイルの光度のマトリックス。このデータでPCAを計算し、推定される主成分をプロットします。これは非常に啓発的な実験です!上位の固有ベクトルのほとんどが、実際にDCT基底の一種の変調正弦波パターンのように見える可能性が非常に高いです。これは、画像タイルの十分に大きく一般的なセットの場合、DCTは固有基底の非常に優れた近似であることを意味します。音声についても同じことが確認されており、大量の音声録音で推定された、メル間隔の周波数帯域の対数信号エネルギーの固有基底がDCTに近い(したがって、DCTを非相関変換として使用する) MFCCを計算する場合)。