コンピュータービジョンと画像処理の間の(明確な)ライン


14

私はここ数年、コンピュータービジョンと画像処理の両方に取り組んで学び、今では完全な初心者ではないと考えています。

それでも、これらすべての年月の後、それが主にコンピュータビジョン関連であるか、それが画像処理であるかどうかを私の仕事の特定の部分について伝えることは困難です。私はただその行を見ることができません-私が仕事、勉強、研究するとき、私は両方のキーワードで参考資料を読みます。

だから、私はフィールドの比較(違いだけでなく、重複)に焦点を当てて、コンピュータビジョンと画像処理フィールドの定義に興味があります

さらに、(概念的または既存の)実用的なアプリケーション、プロジェクト、および処理/活用の例を示すことは有益だと思います。

  • 単独(またはほとんど)のコンピュータービジョンツールとアイデア
  • 単独で(またはほとんど)画像処理ツールとアイデア
  • 両方の分野のツールとアイデアの組み合わせ

どちらもう一方ではなく、どちらになるのか、または両方になるのかに特に注意

これらのフィールドは非常に関連性があり、「線」はこの質問が求めているほど明確ではないかもしれないことを理解していますが、この質問のポイントは分類するための単純な決定ルールを設計することではないことを理解してください(私の)むしろ、これらの分野の焦点と目標のより良い理解。また、特に質問していなくても、質問の調子で話題になっているような追加情報を歓迎します。


「マシンビジョン」はどうですか?「コンピュータービジョン」の同義語だと思いますか?
アレッサンドロジャコプソン

@uvts_cvs正直に言うと、「マシンビジョン」について教えたことはありません...「コンピュータビジョンタスクを実行するために特化したマシン(組み込みシステム)」のような意味があるかもしれません。たとえば、ライセンスを認識できるカメラについてプレート。しかし、もう一度、私はこれについて間違っているかもしれません:)
ペネロペ

回答:


12

ゴンザレスとウッズは彼らの意見に頼るのに十分な能力がある思います。

画像処理が停止し、画像解析やコンピュータービジョンなどの他の関連分野が開始される場所について、著者間で一般的な合意はありません。時には区別を定義することによって行われるプロセスの入力と出力の両方がイメージされた規律などの画像処理を我々は信じて、これは限定的であることが、やや人工的な境界。たとえば、この定義の下では、画像の平均強度を計算するという単純なタスク(単一の数値を生成する)でさえ、画像処理操作とは見なされません。一方、コンピュータービジョンなどの分野がありますを使用して人間の視覚をエミュレートすることが最終的な目標です。、学習し、視覚的な入力に基づいて推論を行い、アクションを実行できることを含みます。この領域自体は、人間の知能をエミュレートすることを目的とする人工知能(AI)のブランチです。AIの分野は、開発の点で初期の初期段階にあり、当初の予想よりも進行がはるかに遅かった。画像解析(画像理解とも呼ばれます)の分野は、画像処理とコンピュータービジョンの中間です。

だから私は、主な違いは方法ではなく目標にあると言うでしょう。たとえば、人間が後で使用するために画像向上させることが目的である場合、これは画像処理と呼ばれる場合があります。そして、目標が人間の視覚エミュレートすることである場合(オブジェクト認識、欠陥検出、または自動運転)、コンピュータビジョンに近づきます。ただし、定義によって人間の視覚をエミュレートするには画像の強化も必要になる場合があるため、ほとんどの場合、コンピュータービジョンは画像処理に依存します

画像理解(特徴抽出)は、純粋な画像処理とコンピュータービジョンの両方で等しく使用できます。


良い点..
スペイシー

とてもいい答えです。参照資料と経験からの解釈の完璧な比率。ありがとう
ペネロペ

10

私が理解したように、画像処理の目的は(何らかの形で変換された)画像を取得することです。コンピュータービジョンの目的は、画像の事柄について何かを見つけることです(写真の男が幸せか悲しいか、画像内に車が何台あるか、どのように運転しているかなど)。

単独(またはほとんど)のコンピュータービジョンツールとアイデア

私はそれが可能だとは思わない、私が用語を理解する方法ではない。

単独で(またはほとんど)画像処理ツールとアイデア

たとえば、Adobe Photoshopを使用すると、画像を取得して、より肌の良いスリムな人の画像に変換できます。しかし、画像に描かれているオブジェクトについては何も「知りません」。


例を挙げましょう。現在、コンテンツベースの画像取得に取り組んでいます。ほとんどの人は、それが画像処理だと主張しています。あなたの答えに合うかどうかはわかりません(悪い答えだと言っているのではなく、ただ疑問に思っています)
ペネロペ

1つの指標は次のとおりです。タスクの結果は画像(IP)またはその他のデータ構造(CV)です。CBIRでは、結果は他のデータ構造(画像間の類似性測定など)であるため、コンピュータービジョンと言えます。ウィキペディアによると、それはコンピュータービジョンでもあります。
ニキエストナー

そこで、私は自分でグーグルをやったことがあり、この概要記事を見つけ、引用します:「これらのシステムでは、画像処理アルゴリズム(通常は自動)を使用して、色などの画像プロパティを表す特徴ベクトルを抽出し、テクスチャ、形状。」記事は...私にはかなり固体に見える
ペネロペ

2
はい、すべてのコンピュータービジョンシステムは画像処理アルゴリズムを使用しています。
ニキエストナー

私はあなたの答えや説明の特定の点に異議を唱えません...それはそうではありません...私が思うようにうまくフィットします。しかし、これは議論に変わり、それは逆効果です。だから、私は質問に他の貢献があればいいのですが、それが異なる/より明確な視点を与えることを願っています;)
ペネロペ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.