YCbCr色空間のCbおよびCrコンポーネントについて


11

アディティブ(RGB)、サブストラクティブ(CMYK)、HSVのような色空間に精通していますが、私が現在理解しようとしている記事は、画像のセグメンテーション/オブジェクト定義のためにYCbCr色空間を操作しています。

私は朝のほとんどを費やして、YCbCrを自然に説明できるものを探していますが、理解できません。ここでこの色空間の背後 にある一般的なアイデアについてのわかりやすい直観的な説明と、これらの人たちからの画像のコーディング/圧縮にどのように使用されているかについての説明(すべてphoto.SEについて)を得ました。

RGBからYCbCrを計算するための式は、ウィキペディアで簡単にアクセスできます。

この表現の動機がわかりました。Y成分には、画像に関する(人間の目にとって)最も重要なグレースケール情報が含まれています。

私は約そのCb、Crのキャリー情報だ色を、その(人間の目(感性)中のため)、これらは品質に見える失われずに圧縮することができます。しかし、各クロミナンスコンポーネントは実際には何を表していますか?

記事の執筆者が彼らのアプローチで「クロミナンス情報はオブジェクトの定義において最重要である」と述べているように、私は現在の「Yは強度、CbとCrは何とか色情報を運ぶ」レベルで読んでいることを完全に理解できません。 YCbCrを理解する。

「Cbは...、Crは...」、または「XYを介して/またはXYを使用して見ている場合、実際にはCbコンポーネントを見て...」などの答えを探しています。他の方法で、コンポーネントが一緒に色情報を運ぶだけでなく、各コンポーネントが別々に運ぶ情報を理解するのに役立ちます。

編集

私が探しているタイプの他の色空間の直感的な説明の例を挙げましょう:

RGB:黒い壁に色付きの懐中電灯を照らすように:青い懐中電灯で照らすと、青い反射が見えます。赤い懐中電灯を追加すると、青と赤の混合であるマゼンタの反射が表示されます。

CMYK:水彩絵の具を混ぜるように、「表面が反射する色に追加する」(つまり、背景から色を差し引く)ので、黄色のものとシアンのものを混ぜると、緑を反映して緑の色になります。

HSV:小さな子供は、明るい(価値)ではなく、彩度の高いオブジェクトに惹かれます。色相コンポーネントは「色を与える」ものですが、彩度が低いと、色は白で「薄く」なります。価値の変化は全体を明るくしたり暗くしたりします。

この定義により、それぞれのチャートを覚えることなく、各色空間の色表現が何を意味するかについて直感的に感じることができました。

回答:


7

YUV(またはYCbCr)はHSVに似ていますが、座標が異なります。(YUVとYCbCrの違いはわずかです-主に正確な数式に関連しています)。

V(S,H)(U,V)HSは半径です。大まかな変換は次のようになります:

U=Scos(H)

V=Ssin(H)

あなたは見ることができます このリンクを参照してください。

直感リストに追加するもう1つのこと:

彩度は、スペクトルの観点から見た場合の色の純度です。たとえば、レーザーのスペクトルは非常に狭いため、飽和度が高くなります。


完全を期すために、YUVとYCbCrの違いの説明を追加できますか?
ペネロペ2012年

@Andrey Rubshtein、レーザーの飽和度が高い場合、その逆は本当ですか?つまり、RGBを測定してHSVに変換した場合、飽和度が高いということは、それがコヒーレントレーザーソースから発生している必要があることを意味しますか?ありがとうございました。
フランク

@フランク、必ずしもレーザーではありません。しかし、広いスペクトルで飽和した色を持つことは困難です。幅が広いほど、1つのコンポーネントのみで高い応答を持つことが難しくなります。
Andrey Rubshtein

@Andrey Rubshtein、回答ありがとうございます。飽和強度のmks単位は、単位面積あたりの単位時間あたりのエネルギーです。。飽和エネルギーフルエンスのmks単位は、単位面積あたりのエネルギーです。ソリッドステートレーザーパルスが長い場合、10〜50 ns(ナノ秒)非常に狭いスペクトルの高い飽和は、コヒーレントレーザーソースから発生する必要があることを意味しますか?
フランク

@Andrey Rubshein。あなたは完全に正しいです。低圧ナトリウムライトと同様に、LEDがかなり単色の光を放つことがわかりました。ボーイング737の航空会社のコックピットの窓から観察される全体像とは異なり、レーザーポインタービームを区別するために使用できるコヒーレントレーザーポインターの特徴はありますか?
フランク

2

RGBもYUVも光子周波数または典型的な人間の眼の桿体/錐体反応のいずれかを表すため、「実際に」が何を意味するのかわかりません。しかし、(1,1,0)、(1、-1,0)、(1,0,1)、(1,0、-)のようないくつかのYCrCbカラーパッチを合成することによって、それらがあなたにどのように見えるかを確認できます。 1)など

チャートを含むWikipediaページは次のとおりです。

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

追加:RGBなどは、人間の知覚に対する可能な直感的な理解に一致するように設計(または進化)されました(そして、色の名前は文化的に学習されることが判明しました)。YUVはその反対で、UV領域のノイズ(ノイズの多いNTSCサブバンドに追加される)は見にくく、説明が難しくなるように設計されています。YCrCbは、同じカラーマッピングのバリエーションです。だから、存在しないかもしれない既存の「直感的な」洞察を探してはいけません。おそらく、チャートを「学習」し、現在脳に存在しないかもしれないまったく新しいニューラル接続(またはそのようなもの)を構築することにより、おそらく独自のものを作成します。


YCbCrで取得したいタイプの他の色空間の例を追加しました。これにより、私が求めているタイプの説明が明確になることを願っています。
ペネロペ2012年

0

HSV / HSBを理解すると、YCbCrを理解するのは難しくありません。HSBのBチャネルは彩度に対応します(彩度=飽和http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/)。RGB画像を取得してグレースケールに変換することも、RGBのすべてのチャネルをグレースケールに変換して1つのチャネルにマージすることもできます。単純化するために、100%赤、100%緑、70%青のピクセルがあるとします。平均...(100 + 100 + 70)/ 3を計算すると、値90%が得られます。これは、明るさの90%を意味します。したがって、グレースケールでは、非常に薄い灰色です。ここで、元の色をグレースケールチャネルに向けて表現したい場合、すべての色(赤、緑、青)に対して3つの式が必要になります。値Rとグレースケール、Gとグレースケール、Bとグレースケールの差を計算します。これには4つのチャネル(RGB +クロマ)が必要です。しかし、3つのチャンネルでも同じことができます。緑のチャンネルを少し修正できます。グリーンチャンネルとの差を計算してみましょう。元のグリーンは100%、灰色に変換された緑の新しい値は90%です。差は-10%です。それでは、この違いによってこのピクセルのRチャンネルとBチャンネルを変更しましょう。ガンマ補正またはすべてのチャンネルを実行しました。緑のチャネル値は、グレースケールイメージの場合と同じになります。そのため、グリーンチャネルで計算することはもうありません。緑はY ...クロマチャネルで「エンコード」されています。残りの色(R、B)も調整されます。この例ではRとBが等しいため、R` =オリジナルの90%またはYの100%。Bコンパウンドには、オリジナルに対して+ 20%の差がありますが、ガンマ補正によって変更された後は、Yに対して+ 30%の差があります。さらに単純化するために、3つのコンパウンドすべてに加算する必要がある式のようになっています。赤と青で得られる違いは、CbとCrです。キャラクターは、ブルーチャネルをクロマチャネルと比較し、レッドチャネルをクロマチャネルと比較したとだけ言います。したがって、CbおよびCr。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.