業界標準のJPEG / H.264よりも優れた圧縮を提供する、非常に計算量の多い画像/ビデオ圧縮スキーム


8

広く採用されている業界標準(JPEG / H.264など)と比較して優れた圧縮性能(画像品質を一定に保つ)を提供する画像/ビデオ圧縮スキームを検索しようとしていますが、計算上またはリソースが多すぎるためです。 CPUベースのワークステーションに集中的に実装することは実行不可能であるため、一般的な標準では採用されていません。

フラクタル圧縮は良い例だとしか思いませんでした。コミュニティはそのような例をこれ以上知っていますか?


2
画像に関する限り、JPEG2000などのJPEGよりも高度なアルゴリズムがあります。JPEG2000は改善された圧縮率を提供しますが、その採用の欠如が計算の複雑さに起因するかどうかはわかりません。さらに、JPEGはほとんどのアプリケーションにとって「十分」であると見なされているため、より良いものを使用する動機は特にありません(特に、最近のシステムではディスクストレージが非常に豊富であるため)。プロの写真家のように、最高の画像品質を気にする人は、イメージセンサー出力の生のキャプチャに依存して、しばしば完全に圧縮を回避します。
Jason R

JPEGの品質は、計算に費やす時間よりも、破棄するデータの量に依存すると思います。
内部石

1
主成分分析/ KLT /ホテリング変換は、少数の基底関数で信号を表す場合に、DCTよりもはるかに優れていますが、計算コストが非常に高くなります。誰かが実際に完全な圧縮スキームを実際に行ったかどうかはわかりません。
eglaser 2012年

@eglaser:PCA / KLT /ホテリングについて詳しく説明しますか?回答として回答を投稿していただければ幸いです。
Ang Zhi Ping

1
@eglaser KLTは、エネルギーのコンパクトさの点でDCTより優れています。ただし、必ずしも優れたコーデックであるとは限りません。これは、各画像/ビデオ部分のKLTが一意であるため、結果の係数を送信する必要があるだけでなく、カーネルも送信する必要があるためです。
Dipan Mehta 2012

回答:


8

圧縮にはさまざまな側面があります-画像とビデオのどちらを参照しているかにかかわらず。(オーディオがまったく異なる可能性があるため、ここではこれを言及していません)。

圧縮標準の歴史を実際に見ると、それらが最初に形成されたとき-MPEG1リアルタイムエンコーダーはまれでした。その当時のCPU自体は、リアルタイムにするのに十分ではありませんでした。ただし、コーデックでより複雑なアルゴリズムを使用できなくなったのは、処理の複雑さ(単独)ではありませんでした。(おそらく、特定のアルゴリズムの包含/除外を担当した主な要因は、a。特許、b。実装の実現可能性でした)。

しかし、私は質問をもう少し簡単に言い換えたいと思います:

まだ市場に出回っている(またはまったく来なかったが、一部のアプリケーションでは価値があるかもしれない)圧縮に関する他のどのような研究が利用可能ですか?

以下に注意すべき点をいくつか示します。

1.より良い変換?

DCTはこれまで、すべてのコーデックにわたって普遍的な変換でした。ただし、ウェーブレットの方が優れている可能性があることを示唆する多くの研究論文があります。確かに、唯一のJPEG2000にはウェーブレットが含まれていましたが、その規格自体は大きな打撃ではありませんでした。おそらくそれ何らかの点でDCTより優れていました。特に、ウェーブレットがDCTよりも優れているという主張があります[参照:参照1]

ウェーブレット DCTより計算コストが高いと思います(8x8のDCT実装が高度に最適化されているためです)。しかし、当時はDCTがはるかに広く普及しており、改善の差は人々が切り替えてもそれほど大きくなかったので、市場の観点からはそれほど飛ばなかったと思います。


B

一方で、これはすでにH.264の標準の一部です。これはまだ完全には利用されていません。このような広範囲にわたる大規模な動き推定を実際に実行可能な検索にする必要があります。ほとんどのH.264エンコーダーは、まだこの可能性を最大限に活用する段階にあります。

3.スケーラブルな画像/ビデオの圧縮
スケーラブルな画像とビデオの圧縮は、画像とビデオの多重記述エンコーディングをどのように行うことができるかについての聖杯です。基本的に、同じ画像またはビデオを複数の解像度、量子化(品質)、またはフレームレートでエンコードできます。これらは、同じストリーム内で品質とビットレートの異なるレイヤーを生成します。ストリーミングサーバーは、実際にビットレートと品質を動的に調整して、ビデオを品質に最適に合わせることができます。[参照3]、[参照4]、[参照5]を参照

このうち、実際に成功しているのはプログレッシブJPEGだけです。繰り返しますが、ビットストリームを動的に適応させるという約束はすばらしいですが、そのようなビットレートの推定が可能で、適応のタイプが実際の目的に役立つ実用的なシステムがある場合にのみ機能します。ただし、ビデオドメインでは、標準(MPEG2、MPEG4、およびH.264)でこれをサポートしていますが、これを使用することはほとんどありません。

4.オブジェクトビデオ
これは、おそらく圧縮の究極の聖杯です。MPEG標準化団体自体によって開始されたオブジェクトビデオ[参照6]ですが、これも広範な研究によって裏付けられています。

基本的なアイデアは、個別のオブジェクトに関してビデオをセグメント化し、後でそのような各オブジェクトを個別のプレーンとして扱うことができるということです。各オブジェクトは、異なるビットレート、量子化、フレームレートで適用され、はるかに効率的な予測が行われます。また、photoshop / gimpでの作業と同じように、そのようなオブジェクトを操作できます。

しかし、結局のところ、知覚的に関連するオブジェクトを使用した実世界の画像とビデオのセグメンテーションは難しい問題です!したがって、エンコーダー/デコーダーがある場合でも、物事を可能にするためにrobusとリアルタイムセグメンテーションシステムが必要です。これは、このような階層化されたビデオの形式でビデオを適用して機能させる方法に関して、はるかに未解決の問題です。

5.その他の次元
これとは別に-追加の次元の冗長性をさらに削減しようとするステレオビデオ(別名マルチビュー)および3Dビデオ(ほとんど同じ概念)のコーデックがあります。これはまだここで行われている研究ですが、H.264にはこのためのプロファイルがあります。シネマエンコーディングについても同様です。

この分野にはまだ多くの研究プロジェクトがありますが、ビデオ圧縮は今ではかなりの商品市場です。また、新しいアプリケーションを実質的に生成しない研究や、実装に実現可能性の問題がある場合、その独創性にもかかわらず、実際に生き残ることはできません。

お役に立てれば。

参照:

  1. Zixiang XiongらによるDCTベースおよびウェーブレットベースの画像符号化の比較研究 al。IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY、VOL。9、NO。1999年8月5日、692ページ

  2. ビデオ符号化のための多仮説動き補償予測の効率分析Bernd Girod IEEE TRANSACTIONS ON IMAGE PROCESSING、VOL。9、NO。2000年2月2日173

  3. 空間ドメイン解像度スケーラブルビデオコーディング(Barry G. Haskell、Hsueh-Ming Hang)。手続き SPIE 2094、ビジュアルコミュニケーションおよび画像処理(718年11月(1993年))。

  4. Hayder M. Radha著、IPを介したマルチメディアストリーミング用のMPEG-4細粒度スケーラブルビデオコーディング方法 al。マルチメディア、ボリューム上のIEEEトランザクション。3、NO。2001年3月1日53

  5. Ohm、J.-R.によるスケーラブルビデオコーディングの進歩; IEEEのプロシーディングス2005年1月巻:93号:1 pp。42-56

  6. MPEG-4での動画のオブジェクトベースのテクスチャコーディング、Andr ́ Kaup著、ビデオ技術のための回路とシステムに関するIEEEトランザクション、VOL。9、NO。1999年2月1日5ページ

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.