人間の目は最新のカメラやレンズと比較してどうですか?


23

ほとんどの写真撮影の目標は、その瞬間にそこにいた人が見たものに似たシーンを提示することです。それ以外で意図的に作業する場合でも、人間の視覚は事実上のベースラインです。

したがって、目が私たちのカメラ技術とどのように比較されるかについて何かを知ることは有用であると思われます。心理学、パターン認識、色知覚の問題をできるだけ残して(それは別の質問です!)、人間の目は現代のカメラとレンズと比較してどうですか?

有効な解像度は何ですか?視野?最大(および最小)開口?ISO同等ですか?ダイナミックレンジ?シャッター速度に相当するものはありますか?

カメラとレンズの一部に直接類似する構造(瞳孔と虹彩など)、および人間に固有の特徴(またはカメラでは見られるが生物学では見られないもの)はどのような構造ですか?


+1私も興味があります。質問の一部は、他のより具体的な質問で既に回答されています!
ホセヌノフェレイラ

1
最初の質問をしましたが、一部のユーザーがその主観性に不満を抱き始めたため、自分自身を削除しました。誰も文句を言わない方法で同じ質問をすることができてうれしいです!
tomm89

1
これは興味深い質問ですが、最終的にはリンゴとオレンジを比較することになります。人間の目は、人間が数千年にわたって直面してきた日常の状況に対処するために高度に進化しています。また、目自体は最新のカメラ/レンズシステムに類似していません-脳も含める必要があります(あまり類似していない)、その時点でカメラは適応性、速度、有用性、また、カメラが生成するものは、意味のある何かに解釈するための目/脳なしでは、ほとんど役に立たないことを忘れないでください。
ニック

2
@Nick —絶対に!それがまさに問題のポイントです。リンゴとオレンジ多くの異なる意味のある方法で比較できることを忘れないでください。彼らはしているさまざまな色、彼らは異なるテクスチャを持って、異なる味、彼らは別の成長条件を必要とし、彼らは別の栄養価を持って、彼らは製品の種類を作るために使用されている....
mattdm

1
これらの質問はすべてトピック外としてフラグが付けられていますが、それが本当かどうかはわかりません。ビジョンはすべての写真家の仕事の重要な要素であり、誰もがこれらのトピックに興味があるわけではありませんが、私たちの多くはそうです。これらのフォーラムには多くの技術的および科学的な種類があるため、特に関連する議論だと思います。質問は特に写真に関するものであり、人々はそれらに答えているので、閉会する票はありません。
jrista

回答:


11

現代のカメラレンズと比較して、人間の目は本当にひどいものです。

一方、人間の視覚システムは、最新のカメラシステム(レンズ、センサー、ファームウェア)をはるかに上回っています。

  • 人間の目は中心でのみ鋭い。実際、中心窩と呼ばれる非常に小さなスポットでは、シャープなだけです。これは、視野の合計角度の1%未満の直径のスポットです。そのため、いくつかの深刻なコーナーソフトネスが進行しています。

    ただし、人間の脳はこれを修正できます。目の周りで非常に速い動きをするように指示し、中央の鋭い部分が周りを囲むようにします。脳は、体内での画像の安定化が非常に優れています。これは、これらすべての急速な動きを取り、それらをつなぎ合わせて1つのシャープなシーンを作るためです。

  • 人間の目は光に非常に敏感ですが、低光レベルでは色情報は利用できません。これに加えて、中央の鋭い部分(中心窩)は光に対する感度が低くなります。

    技術的には、目には3色(赤、緑、青)のコーンと呼ばれる別々のフォトサイトがあり、ロッドと呼ばれる別の異なるタイプのフォトサイトがあり、白黒のみをキャプチャしますが、はるかに効率的です。

    脳はこれらすべてをつなぎ合わせて、日中に優れたフルカラー画像を作成しますが、本当に暗くても、すべてのロッドで作られた柔らかく無色の画像を作成します。

  • 目にはレンズ要素が1つしかなく、紫色のフリンジの形でひどい色収差が生じます。

    実際、この縞はすべて光の非常に短い波長にあります。人間の視覚系は、これらの青と紫に最も敏感ではありません。これに加えて、存在するフリンジをいくつかの方法で修正できます。第一に、人間の視覚システムは中央でのみシャープであり、色収差が最も少ない場所です。次に、色の解像度は(中心窩の外で)明るさの解像度よりもはるかに低いため、脳は明るさを計算するときに青を使用する傾向がありません。

  • 三次元で見ることができます。これは、2つの目があり、脳がそれらの間の収束に関連する驚くべき計算を行えるためです。しかし、それはそれよりも高度です。ステレオビジョンから得られる「3D効果」に加えて、脳はシーンの2次元の写真を見ている場合でも、3次元でシーンを再構築することもできます。これは、オクルージョン、シャドウ、遠近法、サイズの手がかりなどのキューを理解し、これらすべてを使用してシーンを3Dスペースとしてまとめるためです。長い廊下の写真を見ると、脳は遠近感を理解しているため、ステレオビジョンを持っていなくても、廊下が私たちから離れていることがわかります。


ブラインドスポットは言及することも興味深いものです
clabacchio

10

ウィキペディアの記事から多くの助けを借りて)

私たちの目は2レンズシステムであり、1つ目は外側の目であり、2つ目は目の内側のレンズです。目の焦点距離は約22〜24 mmです。中央よりもエッジよりもかなり高い解像度があります。解像度は、画像のどこを見ているかによって大きく異なりますが、中央部では約1.2アーク分/ラインペアです。約600〜700万個のセンサーがあるため、6〜7メガピクセルですが、多少異なります。色検出器のパターンは非常に均一ではなく、周辺視野と比較して中央に異なる色検出機能があります。視野は中心から約90度です。

興味深い点の1つは、人間の目が完全な「スナップショット」を形成することはありませんが、より連続的なシステムであることです。私たちの脳はそれを修正するのに非常に優れているため、これを伝えるのは非常に難しい場合がありますが、私たちのシステムは写真への漏れやすいバケツアプローチです。

「通常の」レンズは、通常、人間の焦点の主要な領域を表すために選択されるため、それらの違いを説明します。

カメラにはさまざまな種類のセンサーがありますが、通常はセンサーの周りに非常に均一に広がっています。センサーは常に平らであり(人間のセンサーは湾曲しています)、エッジの歪みにつながる可能性があります。人間の視覚と同じ形式で解像度を取得することは難しく、レンズにある程度依存しますが、人間の目は焦点の中心でより高い解像度を持っていますが、周辺領域ではより低い解像度を持っていると安全に言うことができます。


1
私の他の答えの1つで少し議論された解像度に関しては、1/60度(1分角)は20/20の視力のためです。これはほとんどの人にとって「正常」ですが、20/10を大人と見なす人は何百万人もいます。また、子供の視力は20/10または20/8の範囲であり、これは約0.4〜0.75分角です。
jrista

外眼のパフォーマンスが低下しているということではなく、別の仕事をしているということです。視野の中心は、私たちが細かい視力を持っている場所です。一方、外の目は、暗い場所などの状況に適しています。
ザカリーK

5

Pixiqには、この問題に関する非常に興味深い記事があり、数日前にリリースされました:http : //web.archive.org/web/20130102112517/http ://www.pixiq.com/article/eyes-vs-cameras

彼らは、ISOの等価性、焦点、絞り、シャッター速度などについて話します。それは議論の対象ですが、読むのはまだ面白いです。

目自体は優れた技術ですが、脳はそれらの要素を組み立てる際に多くの作業を行います。たとえば、非常に大きなダイナミックレンジを知覚することはできますが、これは主に、脳がさまざまな領域を一緒に組み立てているためです。解像度についても同じように、目は中心で良好な解像度を持っていますが、実際には他のどこよりも劣っています。脳は私たちのために詳細を組み立てます。色についても同じように、中心部の色だけを認識しますが、脳は中心部から外れると色情報をキャッシュすることで私たちを欺きます。


1

質問を投げ返してみましょう。レコードのビットレートとビット深度はどのくらいですか?

カメラは、可能な限り忠実に、CCDに投影される画像を再現するように設計されたデバイスです。人間の目は進化したデバイスであり、その目的は単に生存率を高めることです。それは非常に複雑で、しばしば直感に反して振る舞います。それらには類似点がほとんどありません。

  • 光を集束するための光学構造
  • 投影光を検出する受容膜

網膜の光受容体

目自体は目立ちません。私たちには数百万の光受容体がありますが、それらは私たちの脳に冗長な(同時に曖昧な!)入力を提供します。rod体光受容体は、光に対して非常に敏感であり(特にスペクトルの青味がかった側)、単一の光子を検出できます。暗闇では、暗所視と呼ばれるモードで非常によく機能します。たそがれ時など、明るくなると、錐体細胞が目を覚まし始めます。コーンセルは、光を検出するために少なくとも約100個の光子を必要とします。この明るさでは、rod視細胞と呼ばれるモードで、rod体細胞と錐体細胞の両方がアクティブになります。このとき、Rod体細胞は少量の色情報を提供します。明るくなるにつれて、rod体細胞は飽和し、光検出器として機能できなくなります。これは明所視と呼ばれ、錐体細胞のみが機能します。

生物材料は驚くほど反射的です。何もしなければ、光受容体を通過して目の後ろに当たる光が斜めに反射し、歪んだ画像が作成されます。これは、メラニンを使用して光を吸収する網膜の最終細胞層によって解決されます。優れた夜間視力を必要とする動物では、この層は意図的に反射するため、光受容体を逃した光子は、帰路でそれらに当たる可能性があります。これが猫が反射網膜を持っている理由です!

カメラと目のもう1つの違いは、センサーの位置です。カメラでは、それらは光の経路にすぐに配置されます。目には、すべてが後方です。網膜回路は光と光受容体の間にあるため、光子はあらゆる種類の細胞の層と血管を通過してから、最終的にrod体または錐体に到達する必要があります。これにより、光がわずかに歪む可能性があります。幸いなことに、私たちの目は自動的に調整されるため、真っ赤な血管が行き来する世界を見つめ続けることはありません!

目の中心は、すべての高解像度の受信が行われる場所で、周辺部は徐々にディテールに対する感度が低下し、色盲はますます増えます(ただし、少量の光や動きに対する感度は高くなります)。私たちの脳は、非常に洗練されたパターンで目を素早く動かして、世界から最大限の詳細を得ることができるようにすることでこれに対処しています。カメラも実際には似ていますが、筋肉を使用するのではなく、各CCD受容体を高速スキャンパターンで順番にサンプリングします。このスキャンは、サッカードの動きよりもはるかに高速ですが、一度に1ピクセルのみに制限されます。人間の目は遅くなります(そしてスキャンはプログレッシブで網羅的ではありません)が、一度に多くを取り込むことができます。

網膜で行われる前処理

網膜自体は、実際にはかなり多くの前処理を行います。セルの物理レイアウトは、最も関連性の高い情報を処理および抽出するように設計されています。

カメラの各ピクセルには、保存されているデジタルピクセルが1対1でマッピングされていますが(少なくとも可逆画像の場合)、網膜のour体と錐体の動作は異なります。単一の「ピクセル」は、実際には受容野と呼ばれる光受容体の輪です。これを理解するには、網膜の回路の基本的な理解が必要です。

網膜回路

主要な構成要素は光受容体であり、それぞれが単一の双極細胞に接続し、さらに双極細胞が視神経を通って脳に達する神経節に接続します。神経節細胞は、複数の双極細胞から入力を受け取ります。これは、中央サラウンド受容野と呼ばれるリング内にあります。リングとリングのサラウンドが反対として振る舞う場合の中心。中心活性化する光は神経節細胞を興奮させますが、サラウンド活性化する光それを抑制します(中心上、非周囲のフィールド)。これが逆になっている神経細胞もあります(中心から外れ、周辺で)。

受容野

この技術により、エッジ検出とコントラストが大幅に改善され、プロセスの精度が犠牲になります。しかし、受容野間の重なり(単一の光受容体が複数の神経節細胞への入力として機能できる)により、脳は見ているものを推定することができます。これは、脳に向かう情報はすでに高度にエンコードされており、視神経に直接接続している脳とコンピューターのインターフェースでは認識できるものを生成できないということです。他の人が述べたように、私たちの脳は驚くべき後処理機能を提供するため、このようにエンコードされます。これは目とは直接関係ないので、あまり詳しく説明しません。基本は、脳が個々の線(エッジ)を検出し、次にその長さ、次に運動の方向を、それぞれ皮質のより深い領域で検出し、高解像度の色と動きをそれぞれ処理するのに役立つ腹側ストリーム背側ストリーム

エッジコントラスト

中心窩アイの中心であると、他の人が指摘したように、私たちの視力のほとんどはどこから来るのです。それは錐体細胞のみを含み、網膜の他の部分とは異なり、私たちが見るものと1:1のマッピングを持っています。単一の錐体光受容体は、単一の神経節細胞に接続する単一の双極細胞に接続します。

目のスペック

目はカメラになるように設計されていないため、これらの質問の多くに好きな方法で答えることはできません。

有効な解像度は何ですか?

カメラでは、かなり均一な精度があります。周辺は中心と同じくらい良いので、絶対解像度でカメラを測定することは理にかなっています。一方、目は長方形だけでなく、目の異なる部分が異なる精度で見えます。解像度を測定する代わりに、目はほとんどの場合VAで測定されます。20/20 VAは平均です。VAが20/200の場合、法的に盲目になります。別の測定値はLogMARですが、あまり一般的ではありません。

視野?

両目を考慮すると、水平方向の視野は210度、垂直方向の視野は150度です。水平面の115度は両眼視が可能です。ただし、高解像度のビジョンを提供できるのはわずか6度です。

最大(および最小)開口?

通常、瞳孔の直径は4 mmです。最大範囲は2 mm(f / 8.3)〜8 mm(f / 2.1)です。カメラとは異なり、露出などを調整するために手動で絞りを制御することはできません。目の後ろの小さな神経節である毛様体神経節は、周囲光に基づいて瞳孔を自動的に調整します。

ISO同等ですか?

それぞれ異なる感度を持つ2つの光受容体タイプがあるため、これを直接測定することはできません。少なくとも、単一の光子を検出することができます(ただし、網膜に衝突する光子がrod体細胞に衝突することを保証するものではありません)。さらに、10秒間凝視しても何も得られないため、余分な露出はほとんど意味がありません。そのため、ISOはこの目的に適した測定値ではありません。

天体写真家による球場内での推定値は500-1000 ISOのようで、昼光ISOは1になります。しかし、これは目に適用するのに適した測定ではありません。

ダイナミックレンジ?

眼のダイナミックレンジ自体が異なる要因は暗所視、薄明視、および明所視のために遊びに来るように、動的です。これは、人間の目のダイナミックレンジとデジタルカメラのダイナミックレンジをどのように比較するかでよく探求されているようです。

シャッター速度に相当するものはありますか?

人間の目はビデオカメラに似ています。一度にすべてを取り込み、処理して脳に送ります。シャッタースピード(またはFPS)に最も近いものは、CFFまたはクリティカルフュージョン周波数で、フリッカーフュージョンレートとも呼ばれます。これは、時間周波数が増加する断続的な光が単一の固体光に混ざる移行点として定義されます。CFFは周辺部で高く(間接的に見た場合にのみ古い蛍光灯のちらつきを見ることができる理由です)、明るいときは高くなります。明るい光では、視覚システムのCFFは約60になります。暗闇では、10まで低下する可能性があります。

ただし、これはすべてではありません。これは、脳の視覚的な持続性が原因であることが多いためです。目自体のCFFは高くなっていますが(現時点ではソースを見つけることができませんが、100桁の規模であることを覚えているようです)、処理の負荷を減らし、より多くの時間を与えるために、脳は物事を一緒にぼかします一時的な刺激を分析します。

カメラと目を比較しよう

目とカメラは、表面的には同じことをしているように見える場合でも、まったく異なる目的を持っています。カメラは、特定の種類の測定を容易にする仮定に基づいて意図的に構築されていますが、目の進化のためにそのような計画は作用しませんでした。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.