知っているように、特定の光線の色はその周波数(または波長)に依存します。また、それはデジタルカメラで最初にキャプチャされる情報ではありませんか?次に、RGB(またはCMYK、HSVなど)などの形式を使用してデジタルで色を表現する理由
知っているように、特定の光線の色はその周波数(または波長)に依存します。また、それはデジタルカメラで最初にキャプチャされる情報ではありませんか?次に、RGB(またはCMYK、HSVなど)などの形式を使用してデジタルで色を表現する理由
回答:
以前の回答にはいくつかの誤解があると思うので、ここに私が本当だと思うことを示します。参照:太田昇とアランR.ロバートソン、比色分析:基礎と応用(2005)。
光源は単一の周波数を持つ必要はありません。世界で見られる反射光のほとんどは、単一の周波数を持つ必要はありません。代わりに、エネルギースペクトル、つまり周波数の関数としてのエネルギー含有量があります。スペクトルは、分光光度計と呼ばれる機器で測定できます。
19世紀に発見されたように、人間は多くの異なるスペクトルが同じ色を持っていると見ています。2つの異なるスペクトルの光がランプとフィルターによって生成され、人々に尋ねられる実験が行われますが、これらは同じ色ですか?このような実験により、人々はスペクトルを見るのではなく、特定の重み関数との積分のみを見ることができます。
デジタルカメラは、さまざまなフィルターで覆われた一連のフォトダイオードの光に対する応答をキャプチャしますが、分光光度計で見るような完全なスペクトルはキャプチャしません。3つまたは4つの異なるタイプのフィルターが使用されます。多くの人々は、カメラメーカーによって生のファイルが多かれ少なかれ「調理」されていると疑っていますが、結果はカメラによる生のファイル出力に保存されます(カメラセンサーはもちろん独自性が高い)。生データにマトリックス変換を適用することにより、生理学的反応を近似できます。
便宜上、生理学的反応の近似値を使用するのではなく、他のタイプの数字のトリプルを使用して色に名前を付けています。たとえば、https://en.wikipedia.org/wiki/Lab_color_spaceで説明されているLab です。推定される生理学的反応の全範囲を表現できるトリプルを、RGBのような他のものと区別する必要があります。後者は、コンピューター画面で表示できる色を表現するために使用されます。これらは、Labのようなトリプルまたは生データからの変換の結果です。CMYKはプリンター用です。
イメージングエンジニアの目標は、常にカメラで外の世界の忠実な画像をキャプチャし、観察者が実物の写真を見るようにその画像を提示することでした。この目標は達成されていません。実際、今日作られた最高の画像は虚弱です。この目標を達成するには、太陽に照らされた景色の画像を快適に見るためにサングラスが必要です。
あなたは、なぜカメラが人間の視覚的反応を生み出した放射エネルギーの全範囲をキャプチャしないのかを尋ねています。現代のカメラは、赤、緑、青の原色と呼ばれる3つの狭いセグメントしかキャプチャしないのはなぜですか?
答えは、私たちが見る方法のカテゴリー、すなわち人間の視覚反応に分類されます。長年にわたって、人間の色の見え方に関して多くの理論が提案されてきました。これまでのところ、私たちが色をどのように見るかのあらゆる側面について満足のいく説明をすることができませんでした。私たちの目が敏感な波長範囲は、400から700ミリミクロンの範囲に及びます。地球の大気がこの範囲に対して透明であることは偶然ではありません。
光源を見つめるとき、それが単独で提示されない限り、特定の波長を区別することはできません。白色光源を見ると、特定の色を分離して識別することはできません。私たちの目と脳の組み合わせは、周波数の混合を構成するものを分析することなく、光の色を解釈します。これを活用して、科学者は実験により、さまざまな比率で3色のみを混合することにより、ほとんどすべての色を生成できることを証明しました。言い換えると、人間の目には、さまざまな強度で、赤、緑、青の混合で、ほとんどのスペクトル色を再現できますが、正確ではなく、厳密に近似しています。これはトーマス・ヤング(イギリス1773 – 1829)の「色覚のヤング理論」という題名の作品でした。
ヤングの理論に基づいて、ジェームズ・クラーク・マクスウェル(英国の1831年-1879年)は、世界に最初のカラー写真写真が制作されたことを示しました。1855年、彼は3台のプロジェクターを使用し、1つのスクリーンに投影された3つの画像を重ね合わせました。各プロジェクターには色付きフィルターが取り付けられていました。3つの画像は、それぞれ3つの明るい原色、つまり赤、緑、青の1つでした。投影されたフィルム画像は、3枚の白黒フィルムに3枚の個別の写真を撮ることによって作成され、それぞれが3つのライトプレミアの1つのフィルターを通して露光されました。
1855年のその日以来、カラー写真を作成および表示するための無数の方法が検討されてきました。初期のカラー映画は、わずか2色を使用して微弱なカラー画像を投影していました。エドウィン・ランド(アメリカ1909 – 1991)ポラロイド社の創設者は、2つの原色のみを使用してカラー写真を作成する実験を行いました。これは実験室の好奇心のままでした。これまでのところ、最も忠実なカラー画像は3つの原色を使用して作成されています。しかし、一人の男、ガブリエルリップマン(フランス1845 – 1921)は、視覚光スペクトル全体を捉えた美しいカラー画像を作成しました。彼は黒と白のフィルムに鏡の裏付けを使用する方法を考案しました。露光光はフィルムを透過し、ミラーに当たり、反射してフィルムに戻りました。したがって、露光は、露光光の2回の通過によって行われました。露光光の波長に等しい間隔で配置された銀で構成される画像。見ると、フィルムは露光光の波長に一致する光のみを通過させました。顔料の染料を含まないフルカラーの写真を見ることができます。ユニークで美しいリップマンプロセスは非実用的です。当社のフィルムおよびデジタルカメラは、マックスウェルが使用した方法にフォールバックします。おそらく、あなたが人間の視覚と色彩理論を勉強すれば、おそらくあなたは私たちの科学を進歩させ、最初の真に忠実なイメージを得る人になるでしょう。当社のフィルムおよびデジタルカメラは、マックスウェルが使用した方法にフォールバックします。おそらく、あなたが人間の視覚と色彩理論を勉強すれば、おそらくあなたは私たちの科学を進歩させ、最初の真に忠実なイメージを得る人になるでしょう。当社のフィルムおよびデジタルカメラは、マックスウェルが使用した方法にフォールバックします。おそらく、あなたが人間の視覚と色彩理論を勉強すれば、おそらくあなたは私たちの科学を進歩させ、最初の真に忠実なイメージを得る人になるでしょう。
あなたが言った、
これは、最初にデジタルカメラでキャプチャされる情報です。
それは正しくありません。ほとんどのデジタルカメラのセンサーは、それ自体で、人間が赤外線および紫外線スペクトルで見ることができるものを超えて、光の周波数帯域に応答します。センサーはこのような広いスペクトルの光をキャプチャするため、光の波長の恐ろしい識別器です。つまり、大まかに言えば、デジタルセンサーは白黒で表示されます。
ほとんどのカメラセンサー¹では、色をキャプチャするために、カラーフィルターアレイ(CFA)と呼ばれるカラーフィルターがセンサーの前に配置されます。CFAは、各センサーピクセル(センスと呼ばれることもあります)を主に赤、緑、または青の光センサーに変換します。生のセンサーデータを白黒画像として表示すると、ハーフトーンの白黒新聞用紙の画像のように、ディザリングされたように見えます。高倍率でズームインすると、画像の個々のピクセルは市松模様のような外観になります。
生の画像データの個々の正方形を必要に応じて赤、緑、または青として解釈すると、カラーハーフトーン新聞印刷記事に似た画像のカラーディザバージョンが表示されます。
バイエルカラーフィルター配列、ユーザーCburnett、ウィキメディアコモンズ CC BY-SA 3.0
画像データをカメラに保存するとき、またはコンピューターで後処理するときにデモザイキングと呼ばれるプロセスを介して、色データの配列を計算的に組み合わせて、フル解像度のRGBカラー画像を作成します。デモザイク処理では、各ピクセルのRGB値は、ピクセルの値だけでなく、周囲のピクセルのデータも考慮するアルゴリズムによって計算されます。
では、なぜRGB形式を使用してデジタルで色を表現するのでしょうか?
それは人間が色を認識する方法であるため、三色モデルを使用します。Wikipedia'a Trichromacyの記事から、
三色性の色理論は18世紀に始まり、トーマスヤングは色覚は3つの異なる光受容細胞の結果であると提案しました。ヘルマン・フォン・ヘルムホルツは後に、通常の視覚を持つ人々が通常の色の範囲を作成するために3つの波長を必要とすることを示すカラーマッチング実験を使用して、ヤングのアイデアを拡大しました。
したがって、私たちは、見ることができるものにやや似た方法で、見ることができるものをキャプチャするカメラを構築します。たとえば、私たちが見ているものをキャプチャして再現することを目的とする一般的な写真の場合、赤外線と紫外線の波長もキャプチャすることはほとんど意味がありません。
すべてのセンサーがCFAを使用するわけではありません。Foveon社のX3のシグマデジタル一眼レフカメラとミラーレスカメラで使用されるセンサーは、異なる深さに光貫通シリコンの異なる波長という事実に依存しています。X3センサーの各ピクセルは、赤、緑、青を検出するフォトダイオードのスタックです。各ピクセルは本当にRGBセンサーであるため、Foveonセンサーにデモザイキングは必要ありません。
ライカMモノクロームは、センサー上のCFAを持っていない高価な黒と白のカメラのみです。入射光のフィルタリングがないため、カメラは光に対してより敏感です(ライカによると、100%、または1ストップ、より敏感です)。
カメラとディスプレイがRGBで機能する理由は、網膜がそのように機能するためです。
私たちの目はそれらのコンポーネント(RGB)で色をエンコードするので、純粋な波長(各色成分の網膜応答の多かれ少なかれ決定的な組み合わせを形成する)だけでなく、非常に便利なシステムです(確かに唯一ではありません) 、また混合色。
理論的根拠は、「色の組み合わせが3つのコンポーネントの組み合わせとして脳にしか配信できない場合、それらの分離された純粋なコンポーネントの特定の組み合わせ(RGBディスプレイ経由)を提示することで視覚システムをごまかすことができ、システムはそれらを本物のようにデコードします。
私たちは三色なので、ほとんどの色システムは本質的に三次元(Lab、HSV、YCbCr、YUVなど)であり、色の固有の物理的性質ではなく、私たちの視覚システムは機能します。
単純に答える試み:
可視スペクトル内であっても、存在するすべての異なる波長の光の完全な内訳を周波数ごとに保存するのに十分な情報を実際にキャプチャすることはできません。RGBを使用すると、わずか3つの数字を使用してピクセルの色を記述することができます。光の周波数スペクトル全体をキャプチャする場合、1つのピクセルごとに3つの数値ではなく、データのグラフが必要になります。データの送信と保存は計り知れない。
私たちの目には必要ありません。私たちの目は3つの単一波長を見るだけでなく、代わりに「赤」、「緑」、「青」の各受容体が部分的に重複する光の範囲を捉えます。
オーバーラップにより、脳は信号の相対強度を原色間で異なる色として解釈できるため、3つの原色の相対信号強度のみを考慮して、ビジョンシステムは実際の波長を近似するのにすでに優れています。RGBカラーモデルは、これと同じレベルの情報を適切に再現します。
相互作用する理由は2つあります。
理由(1)は、目が(通常)任意の与えられたポイントからの複数の波長の光を受け取ることです[いわば]。たとえば、白色光は、実際には[原則として]多くの多様な波長の混合物です。「白い」波長はありません。同様に、マゼンタ(最近では「ピンク」と呼ばれることが多い(「ホットピンク」経由))は赤と青の混合ですが、緑はありません(白く見えるようになります)。同様に、緑色に見えるものには、石灰とシアンの成分が含まれている場合があります。
理由(2)は、RGBが人間の目がどのように機能するかということです。赤、緑、青のセンサーがあります。
したがって、(1)と(2)を組み合わせて、元の信号を解釈するのと同じ方法で人間の脳に光信号を解釈させるには、それらをその用語でエンコードする必要があります。
たとえば、(逆に)オリジナルが(人が知覚する)白色光であるが、たとえば紫と赤のセンサー(2つだけ)を使用してエンコードされた場合、再現は人間の目にはマゼンタとして表示されます。同様に、より微妙にまたは細かく...全範囲の色の混合である白色光...これがたとえば紫、黄色、赤のセンサーを使用してエンコードされた場合...この再現は人間の目には純粋な白ではないように見えます— (オフハンド)黄色がかったオフホワイトとして。逆に、それは目の中に同じセンサー(つまり、紫、黄色、赤)を持つ架空の宇宙人(そしておそらく実際の動物にとって)に純粋な白のように見えます。
同じ理由で…オリジナルが白、つまり全範囲の色の混合である場合、人間の目はこれを赤、緑、青のみでエンコードし、赤、緑のみを使用して再現します青(同じ比率で)は人間の知覚では純粋な白に見えます。つまり、情報はどちらの場合でも失われますが、損失が対応するため、最終結果は完璧に見えます。残念ながら、カメラのセンサー[RGB]が人間の目のセンサー[RGB]とまったく同じ感度曲線を持つ場合にのみ正確に対応します [各センサーは色の範囲によってアクティブになります] 、2つのケースで、ライム色が赤、緑、青の各センサーをまったく同じ量だけアクティブにしました。
tl; dr:周波数を正確に分析するよりも、スペクトルの広い3つの部分で光を検出する方がはるかに簡単です。また、よりシンプルな検出器は、より小さくできることを意味します。3番目の理由:RGB色空間は、人間の目の動作原理を模倣しています。
マックスプランクが証明したように、すべての熱い体はさまざまな周波数の放射線を放出します。彼は推測し、エネルギーがフォトンと呼ばれるバーストで放射されることを証明しました。そしてその日から、物理学は決して同じではありませんでした。唯一の例外は、1つの周波数のみの放射線を放出し、いくつかの分離された周波数の放射線(ネオンバーなど)を放出する理想的なLASER / MASERです。
周波数にわたる強度の分布はスペクトルと呼ばれます。同様に、検出器にもスペクトルがあります。その場合、正規化された強度の放射に対する検出器の応答の分布です。
すでに述べたように、私たちの目は進化的に較正されており、遠赤外線から紫外線までの範囲の太陽光を白として見るため、白色光は白です。たとえば、葉は緑です。なぜなら、葉は、緑として見える部分を除くすべての周波数を吸収するからです。
もちろん、スペクトルを収集して情報を抽出できる検出器があります。それらは、化学組成または微細構造がスペクトルから評価される、発光分光法およびX線回折および蛍光技術で使用されます。写真の場合、やり過ぎです。「化学」組成を評価したいが、画像は偽色に「変換」される天体写真を除きます。これらの検出器は正確で、巨大または小型ですが、不正確であり、分析するにはさらに多くの計算能力が必要です。
人間の目、または他の目は、そうではありません。オブジェクトの化学組成や結合状態はわかりません。目には、4つの異なる「検出器」があります。
虹、またはCDやDVDを見ると、色が赤から紫に変わります。虹の特定の部分の光線は、ほとんどが1つの小胞周波数です。赤外線は目に見えず、網膜の細胞を刺激しません。周波数を上げると、ビームは赤色の「セル」のみを励起し始め、色icは赤色で表示されます。ビームが「主に赤い細胞」を励起し、少しが「緑」を励起する周波数を上げると、色がオレンジ色に見えます。黄色のビームが「緑」をもう少し刺激します...
カメラのセンサー(CCDまたはCMOS)は、あらゆる周波数の光線によって励起され、人間の目を模倣した色として目が見える写真を撮ります。たとえば、ベイズフィルターを使用します。これは、網膜の細胞タイプに意図的に類似した透過スペクトルを持つ3つのカラーフィルターで構成されています。
太陽に照らされた黄色い紙からの反射光は、「赤」を完全に(100%)、「緑」を完全に(100%)、わずかに「青」(5%)を出るため、黄色に見えます。それを写真に撮ると、同じように、カメラによって興奮が集められます。画面上の画像を見ると、画面は100個の赤い光子、100個の緑色の光子、5個の青色の光子を非常に短い時間であなたに向けて送ります。網膜の興奮レベルは、直接観察によって引き起こされる興奮と同様になり、黄色い紙の写真が表示されます。
色を再現したい場合、解決すべき別の問題があります。RGBカラースペースを使用すると、ピクセルごとに3種類の光源しか必要ありません。3つのカラーフィルター(LCDはこのように機能します)、3種類のLED(LEDおよびOLEDパネルが使用)、3種類の発光体(CRTが使用)を使用できます。色を完全に再現する場合は、ピクセルごとに無限の量のフィルター/ソースが必要になります。情報を色から周波数に単純化して使用したい場合も、役に立ちません。
温度によって色を再現することもできます。私はあなたが赤オレンジ黄色黄色の色のみを再現することができ、各ピクセルを3000K前後の温度に加熱する必要があると思います。
そして、すべての理論的なケースにおいて、あなたの目は実際に本当の色をRGB信号に変換し、あなたの脳に伝えます。
解決する別の問題は、データを保存する方法ですか?従来の18MPx RGBイメージは、3つのマトリックス5184x3456セルで構成され、各ポイントは8ビットサイズです。つまり、画像あたり51 MiBの非圧縮ファイルを意味します。すべてのピクセルの完全なスペクトルを、たとえば8ビットの解像度で保存したい場合、5184x3456x256ユーバーマトリックスで、4 GiBの非圧縮ファイルになります。つまり、430〜770 THzの範囲で256の異なる周波数の強度を保存することを意味します。つまり、チャネルごとに1,3 THz間隔の解像度を意味します。
私が言うことができる場合、努力の価値は全くありません...
簡単な答え:波長は単一の値であり、知覚できる色の範囲全体を単一の値で表現できないため、直方体の寸法を超えて単一の測定値で表現することはできません。
類推を続けるには、ソリッドのボリュームを引用することができますが、同じボリュームを持つ多くの異なるソリッドがあります。
RGB、CMY、HLSなどはすべて、3つの「次元」を使用します。これは、人間が見る色を適切に記述するために必要な多くの要素であるためです。
HLSシステムでは、波長は色相に相当しますが、明るさや彩度を伝えることはできません。
Reは、「また、([波長])ということは、第1のデジタルカメラで撮影された情報ではないのですか?」、いいえ、そうではありません。
他の人が指摘しているように、デジカムは赤、緑、青の相対的な強度をキャプチャします。(また、一部の人は、少なくとも1つの追加の色を使用して、重要な赤から緑の領域をより適切に区別しています。)入射光の周波数を直接測定することは、はるかに困難です。私たちには、それを可能にする安価なセンサーがありません。数百万個のグリッドで作成できるセンサーはありません。そして、カメラが明るさと彩度を測定する方法がまだ必要です。