人間の目のような高ダイナミックレンジのセンサーを構築する背後にある技術的な困難は何ですか?


17

写真のすべての部分に適切な露出を備えた高ダイナミックレンジセンサーがまだないのはなぜですか?


2
実際に答えた後、これはすでにここで議論されているのを見まし。それでも解決できない場合は、質問をさらに詳しく説明してください。
mivilar 14

BlackMagic(フルHDビデオ)カメラのEVは14で、最新のプロフェッショナルビデオカメラ(4K)は18 EVです。私たちは、これらのセンサーを持っていないので...
TFuto

回答:


20

即時および全体の両方で、人間の目よりも大きいDRを備えたカメラが既に存在します。人間の目のダイナミックレンジは、ほとんどの人が考えるほど大きくありません。私が思い出すように、それはおよそ12から16 EVのどこかであり、これは現代のDSLRのレベルのすぐ近くです。

主な違いは、画像のさまざまな部分に合わせて調整する非常に自然な絞り制御があることです。事実上、私たちの脳は画像スタックを自動的に行います。シーンの明るい部分を見ると、瞳孔が縮小し、明るい部分の細部が見えます。私たちが暗い部分に焦点を合わせると、生徒は急速に開き、暗い部分の詳細が見えます。私たちの脳は前の部分がどのように見えるかを知っているので、私たちは周辺視野の変化に気づきませんが、私たちはもはや焦点が合っていない場所ほど多くの詳細を見ていません。

同様に、人間の視覚の全体的な範囲であっても、私たちよりもはるかに暗くなり、特に色を見ることができる特殊なカメラがあります。ノイズフロアを非常に低くします。また、見るのが苦痛になるような非常に明るい物体を見ることができるセンサーもあります。


AJ、DSLRには、眼と同​​じダイナミックレンジがありません。DSLRの場合は14の累乗で2です。人間の目では14の累乗で10です。
ロミオニノフ

@RomeoNinov-インスタントDR用ではなく、見かけ上のもののみ。クレームのソースはありますか?私の情報源はここにあります。「瞳孔の開口部が変化しない場合、代わりに目の瞬間的なダイナミックレンジを考慮すれば、カメラはより良くなります。これは、シーン内のある領域を見てどこにも見ていないような場合には、私たちの目は10-14からどこでも見ることができる最も見積もり「ダイナミックレンジのfは、停止します。
AJヘンダーソン

@RomeoNinov- わずかに優れたリソース。したがって、カメラの性能が悪い場所では目が良くなり、カメラの性能が良い場所では目が悪くなることを指摘する価値があります。影には、カメラがEVを減らした20EVがあります。明るさは約10EVですが、カメラには12〜14EVがあります。10 ^ 14は、目が調整されたときに見える範囲の合計であり、一度に見える範囲ではありません。その点で、カメラも2 ^ 14に制限されていません。
AJヘンダーソン

はい、カメラは生画像のビット深度に制限されています。画像からこれ以上のビットや情報を取得することはできません。脳の「見る」画像は、目からのスナップショット1つだけではなく、さらに2つの目を使用しているため、脳内の画像に多くの追加情報が追加されることに同意します。また、2番目のコメントで言及したリソースでは、10の累乗で表示される目のダイナミックレンジが表示されます。DRがたった12 EVであったとしても、16384である2 ^ 14と比較して10 ^ 12であり、100万ミリオンです
Romeo

1
しかし、たとえば6ストップDRに厳しく制限されたセンサーでも、TvとAvを変更することにより、連続するフレームの非常に暗い値から非常に明るい値まで詳細を測定できます。開口部に関しては、これが目/脳システムの機能です。
マイケルC 14

10

見ることは活発なプロセスです

大きな問題は、目で見ることは画像をキャプチャすることとは非常に異なることです-画像には、見る人見るかもしれないすべての情報を含める必要がありますが、通常の視覚は、目の動き、リフォーカス、瞳孔の拡大を伴うアクティブなプロセスです私たちが見ているオブジェクトに。したがって、必要な「目が見ているもの」をキャプチャする場合は、本質的に、目が使用する可能性のあるすべての設定の視点をキャプチャします。

あなたの質問はダイナミックレンジに関するものですが、視覚的な詳細と焦点に関して同じ問題が発生します。目の解像度は非常に不均等であり、網膜の高解像度の中央で小さなスポットを1つだけ見ているため、「人生と同等」の画像には実際にキャプチャできるピクセルよりもはるかに多くのピクセルが必要です目を動かすので、詳細を確認できます。映画は単一の焦点を選択する必要がありますが、人間は目をすばやくリフォーカスしたり、さまざまな意図した範囲で適切な両眼視のためにそれらを移動したりすることで、より深い「単一画像」を見ることができます(たとえば、窓の表面またはそれを通して見る) )など

ソリューションの一部はまさにそれです-単一のカメラをすばやく複数回(または複数のカメラ)使用してさまざまな設定でさまざまな画像をキャプチャし、後でそれらをマージする、HDRは最も露骨な例です-私たちの目と同じように、それは積極的に見えますさまざまな「設定」を持つさまざまな場所で、その後、あなたの脳がすべてをまとまりのある画像または映画にマージします。私たちの目で撮られた実際の「画像」は、良いカメラよりもすでに悪く、単にそれらの精神的な組み合わせがいいです。


1
映画の焦点についてのあなたのポイントのために+1。これは、3Dムービーを見るときに多くの人が頭痛をする主な理由の1つとも関係しています。目は画面に物理的に焦点を合わせる必要がありますが、立体画像は画面の一部が実際よりも近くまたは遠くにあると脳に思い込ませ、それらを直接見ようとすると眼精疲労を引き起こします。スタジオは、左右の画像の同じ場所にシーンの焦点を表示することにより、これを最小限に抑えようとします。あなたが背景の詳細​​を見てみたいなら、イブプロフェンを忘れないでください!
bcrist 14

見ることがアクティブなプロセスであるという事実は、本当に優れた芸術家が単純な写真よりも見栄えの良い絵画を制作できる理由の1つです。単純な写真は、同じ視点、焦点、露出、ホワイトバランス特性でシーン内のすべてをキャプチャしますが、実際にシーンを表示していた人の目は、異なる部分を見ると絶えず調整されます。画家は、カメラとは異なり、シーンの各部分が実際にその場所にいて見ているように見える画像を生成できます。
-supercat

6

あなたの精神的イメージは、網膜だけでなく、瞳孔やもちろんあなたの脳を含む視覚に関係する他のすべての要素との相互作用の産物です。「一枚の絵」と思われるのは、実際には、単一のスナップショットではなく、高速な調整と情報処理の結果です。

このトピックの詳細については、こちらをご覧ください


1

対数特性を持つ光センサーを作成することは完全に可能です-そのようなセンサーは、特定の露出に対して限られた解像度を犠牲にして信じられないほどのダイナミックレンジを持ちます。両方を取得するには、高分解能ADCが必要です。CTイメージングでは、通常24ビットの線形が使用されます。その後、オフセット調整後に対数が取られ、CTイメージが作成されます。

露出制御(積分時間-シャッタースピードを考える)の両方を行うセンサーはより良い結果が得られ、集光効率の変更を許可する(f値を考える)と、さらに大きな柔軟性が得られます。

最終的なダイナミックレンジは通常、読み出しノイズによって制限されます-蓄積された電荷を読み取ると、電子機器がサポートできる最大の信号に対していくらかの誤差が生じます。私が言ったように、24ビットは医療画像で一般的であり、1000万分の1よりも優れています。それは、与えられた露出に対する網膜よりもはるかに高いダイナミックレンジです。しかし、目は画像の細部を理解できなかったため、従来のカメラでは一般的に使用されていません-解像度は速度を犠牲にします。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.