タグ付けされた質問 「image-processing」

一般に、画像処理は、写真やビデオフレームなどの入力が画像である信号処理の任意の形式です。


2
ピークデータを減らすだけでローパスフィルターをかけるにはどうすればよいですか?
これらの制約/品質メトリックを使用して、ローパスフィルターしたい2D画像があります。 画像に光を「追加」できないため、結果の各ピクセルは入力の対応するピクセル以下でなければなりません。 ローパスカットオフ周波数は、実験するためのパラメーターである必要があります このフィルターを繰り返し適用しても、結果が大きく変わることはありません。 このアルゴリズムの実行にかかる時間(5MPixイメージの場合は5分が妥当と思われる) 除去される光の量を最小限に抑えます。 以下は、私が試したいくつかのアプローチとその欠点です。 通常のガウスフィルター。次に、制約1に準拠するように結果をプルダウンします。これは最初の3ポイントに非常によく適合しますが、必要以上に多くの光を減らします。 「上」の放物線を「低」点と「下」の放物線の間に合わせて滑らかにします。これは1Dでうまく機能しますが、最初に水平に適用し、次に垂直に適用すると2Dで悪い結果になります。時間がかかりますが、私のアプリケーションにとってはそれほど長くはありません。ただし、このフィルターを繰り返し適用すると、結果が大幅に変わります。(1D)入力が完全な「下向き」放物線である場合(これはフィルタリングしないでください)、開始/終了にある2つの「上向き」放物線に置き換えられます。 最適なパラメーターを見つけるために、2Dの「基本」関数と線形解法の他の形式を使用します。これは現在のところアイデアであり、まだ実装/テストされていません。 私の信号処理の経験領域はほとんど画像処理のみであるため、信号処理の他の分野で活躍する専門家の意見を取り入れて、この問題の代替案を見つけたいと考えています。 更新2011/08/18 現在の反応に基づいて、典型的な入力のグラフと、最初に説明した3つのアプローチの結果とこれまでに受け取った提案を追加することで、物事をもう少し明確にすることにしました。比較しやすいように、これらの例では1Dフィルタリングのみを使用しました。 入力データ: ガウスフィルター +要件(1)に準拠するようにダウンさせます。 それを下げると、右側で不必要な減光が生じることがわかります。 放物線 私が考える限り、これは非常に優れています。悲しいことに、最初に水平方向を適用してから垂直方向に適用しても、2Dに完全には変換されません。この場合、浮動小数点解像度で近似放物線を評価できることもわかります。これは小さな利点ですが、絶対に必要というわけではありません。 グレースケールエロージョン rwongからの提案に基づいて、グレースケールエロージョンを試しました。「適合」放物線と同じ放物線形状の構造要素を使用しました。結果はほぼまったく同じなので、これは有望に見えます。ただし、まだいくつかの問題があります。1.構造化要素が「十分な大きさ」ではありませんでした(すでに801ピクセルの幅でした)1.「上向き」放物線しかありません。次へ。 中央値フィルタリング 完全を期すためにのみ含まれていますが、実際に必要なものではありません。 生データ 生の入力データ+さまざまなpythonコマンドをpastebinに貼り付けたため、同じデータを試すこともできます。 http://pastebin.com/ASnJ9M0p

2
FFTの実数部が画像を回転+オリジナルに変換するのはなぜですか?
私はこの画像を読みました: 画像を正確に戻すために、FFT(2D)を取得してから、逆FFTを取得しました。参照用にコードが提供されています。 imfft = fft2(photographer); im = uint8(ifft2(imfft)); imshow(im); %Output is same image しかし、フーリエを変更して実際の部分のみを使用すると、 imfft = real(fft2(photographer)); im = uint8(ifft2(imfft)); imshow(im); 私はこのような画像を取得します(サイズの変更は無関係であり、Matlabの図ハンドラから保存するためだけであることに注意してください): 誰かがその背後にある理論(数学)を説明できますか?ありがとう

4
最も正確なカメラキャリブレーションを取得するにはどうすればよいですか?
まず、これが正しいStack Exchangeボードであることを願っています。そうでない場合、私の謝罪。 カメラのキャリブレーションを必要とするものに取り組んでいます。OpenCV(C ++)でこれを行うためのコードを正常に実装しました。内蔵のチェス盤機能と印刷したチェス盤を使用しています。 インターネットには、チェス盤の複数のビューを提供し、各フレームからコーナーを抽出することを述べた多くのチュートリアルがあります。 最も正確なカメラキャリブレーションを取得するために、関数に与える最適なビューのセットはありますか?キャリブレーションの精度に影響を与えるものは何ですか? たとえば、何も動かさずに同じビューの5つの画像を与えると、ウェブカメラフィードを歪ませようとすると、まっすぐな結果が得られます。 ご参考までに:非対称円のグリッドとそれぞれのOpenCV関数を使用することで、より良いカメラキャリブレーションが必要であることが最近わかりました。


2
なぜガウス分布の違いは空間スケール不変ですか?
ここでは例として、スケール不変の特徴変換アルゴリズムを使用します。SIFTは、画像のスケーリングされたガウスフィルタリングに基づいてスケール空間を作成し、ガウスの差を計算して潜在的な関心点を検出します。これらの点は、ガウス分布の差全体の局所的な最小値と最大値として定義されます。 このアプローチは(他の不可解な不変性の中でも)スケール不変であると主張されています。どうしてこれなの?なぜそうなのかははっきりしていません。

4
写真から交通標識を抽出する方法は?
以下のような画像から交通標識を抽出するには、どのような画像解析技術を使用できますか? 編集: 異方性拡散後:不要な背景が少しクリアされます 拡張後: 拡散後のしきい値処理:この目的に最適なしきい値処理を見つけることができません ただし、背景を削除する方法を理解できませんか? 編集:画像のこれらの部分だけが必要です 別の入力画像を撮影する: 中央値フィルタリングとエッジ検出の適用: ボトムハットフィルタリング後: 道路標識を分離するにはどうすればよいですか?

3
エッジを破壊せずに画像からガウスノイズを除去する方法は?
エッジを破壊せずにガウスノイズを除去するのに最適なフィルターは何ですか?加法ガウスノイズを含む標準のレナ画像を使用しており、異方性拡散を適用する前にノイズを除去したい。エッジがぼやけてしまうので、中央値フィルターを使いたくありません。適応フィルタリングを試みましたが、結果は満足のいくものではありませんでした。

3
OpenCV / C ++は、それらの間の距離に基づいて近くの輪郭を接続します
輪郭を接続するかどうかを指定するそれらの間の距離に基づいて、画像内の近くの輪郭を接続する必要があります。 今、同じ問題に関する質問があります/programming/8973017/opencv-c-obj-c-connect-nearby-contoursが、ここで彼はすべての輪郭を単一の輪郭にマージしています。これは欲しくない。このためのopencvの機能はないと思いますが、そのアルゴリズムを提案できます。私のアプリケーションは次のようになります: 私は手を検出しているので、皮膚検出アルゴリズムを使用してそれらを特定しましたが、私の皮膚は白くなく、ひょっとすると肘の輪郭が壊れていることもあります。だから私は近くの輪郭を接続したいがそれらのすべてではない(両方の私の手が輪郭にあるので)(手によって私は肩から手のひらまでを意味するからです)。 さらに、いくつかのエッジ検出を使用することで、手の境界を取得し、この境界内のこのパッチの一部が皮膚として検出されたかどうかを検出すると、この境界内の領域全体が皮膚として検出されますが、これを行う方法がわかりません部。 どんな助けでもありがたいです。前もって感謝します サンプル画像: この画像では、距離が40ピクセル未満のポイント(8つの接続)を接続したいので、左手を単一の輪郭として取得します 私の目的は、手の輪郭のみを取得することです(他の領域は気にしません)

2
画像を照らす光源の色温度を計算するにはどうすればよいですか?
特定の画像を照らす光源の(黒体に相当する)色温度を計算するにはどうすればよいですか?以下は、色温度とRGBヒストグラムのシフトを操作するAdobe Lightroomのスクリーンショットです。画像のRGBコンポーネントが与えられた場合、どのように計算しますか?単一の値を期待する必要があります-照明源の黒体相当温度ですよね?

1
任意の形状の自動トリミング
バイナリマスクで定義された任意の形状があります(灰色=形状、黒=背景)。 私は灰色のピクセルのみを含む可能な限り大きな長方形を見つけたいです(そのような長方形は黄色で描かれています): 形状は常に「ワンピース」ですが、必ずしも凸状ではありません(形状の境界上のすべてのポイントペアが、形状を通る直線で接続できるわけではありません)。 そのような「最大の長方形」の多くが存在する場合があり、その後、次のようなさらなる制約を導入できます。 中心が図形の重心(または画像の中心)に最も近い長方形を撮影する 定義済みの比率(4:3など)に最も近いアスペクト比を持つ長方形を撮影します アルゴリズムについて最初に考えたのは次のとおりです。 形状の距離変換を計算し、その重心を見つける シェイプのピクセルのみが含まれる正方形の領域を拡大します 長方形(元は正方形)の幅または高さを拡大し、形状のピクセルのみが含まれるようにします。 ただし、このようなアルゴリズムは時間がかかり、最適な解決策にはならないでしょう。 助言がありますか?

3
畳み込みが必要な理由、または畳み込みの背後にある哲学は何ですか?
私はデジタル画像復元の分野で働いています。畳み込みに関するすべてのことを読みました。LTIシステムでは、インパルス応答を知っていれば、入力とインパルス応答の間の畳み込みを使用するだけで出力を見つけることができます。 誰もがその背後にある主要な数学的哲学は何であるか教えてもらえますか?あなたの経験はそれについての単なるインターネットサーフィン以上のものを私に教えてくれます。

5
エッジと長方形を検出する方法
画像内の長方形を検出しようとしています。画像の背景は1色です(ほとんどの場合)。バイナリイメージ(1 =背景、0 =エッジ)を取得し、後でハフ変換を実行する2つの方法を試しました... ソーベルまたはキャニーフィルター 滑らかな画像A、差分画像Aの作成-ガウス、しきい値付きのバイナリ画像の作成(ヒストグラムの作成、最高ビンは背景にする必要があります...) 結果は、エッジのあるバイナリイメージです。さまざまな異なる画像に対してどの方法がよりうまく機能するかは、今ではわかりません。何か案は?

2
画像内の対称領域/パターンを見つける
人間の背面の平均曲率を表す一連の画像があります。 私がやりたいのは、画像のその他の部分に類似した反映された「カウンターパート」を持つポイントの画像を「スキャン」することです(おそらく中央線に対して対称ですが、変形がある可能性があるため必ずしもそうではありません)。一部の画像合成技術では、これを使用して画像間の類似点を「自動検出」しますが、同じ画像の両側でそれらを検出したいです。 最終的な目標は、背中を対称的な「半分」に適応的に分割する、連続した、おそらく最も湾曲した縦線を見つけることです。 サンプル画像を下に配置します。すべての領域が対称ではないことに注意してください(具体的には、画像の中心のすぐ上で、赤い垂直「ストリップ」が右にずれています)。その領域は悪いスコアなどを受け取るはずですが、ローカル対称性は、より遠くに配置された対称点から定義されます。いずれにせよ、アルゴリズムをアプリケーションドメインに適合させる必要がありますが、私が目指しているのは、SOM相関/畳み込み/パターンマッチング戦略であり、既に何かがあるはずです。 (編集:下にさらに画像があり、さらに説明があります) 編集:要求に応じて、行儀が良く問題のあるより典型的な画像を含めます。しかし、カラーマップされた画像の代わりに、それらはグレースケール画像であるため、色はデータの大きさに直接関連します。これは、カラー画像では発生しませんでした(通信のためだけに提供されます)。グレーの画像はカラーの画像と比べてコントラストが欠けているように見えますが、データの勾配があり、必要に応じて適応的なコントラストで表示することができます。 1)非常に対称的な被写体の画像: 2)異なる瞬間の同じ被写体の画像。より多くの「機能」(より多くのグラデーション)がありますが、以前のように「対称」ではありません。 3)より一般的な凹型正中線の代わりに正中線に凸部(骨の突起、より明るい領域で示される)を備えた薄い若い被験者: 4)X線で確認された脊椎の逸脱のある若者(非対称性に注意): 5)典型的な「傾けられた」対象(ほとんどが湾曲した正中線の周りで対称的であり、それ自体は適切に「変形」していない): どんな助けも大歓迎です!

2
コンピュータービジョンと画像処理の間の(明確な)ライン
私はここ数年、コンピュータービジョンと画像処理の両方に取り組んで学び、今では完全な初心者ではないと考えています。 それでも、これらすべての年月の後、それが主にコンピュータビジョン関連であるか、それが画像処理であるかどうかを私の仕事の特定の部分について伝えることは困難です。私はただその行を見ることができません-私が仕事、勉強、研究するとき、私は両方のキーワードで参考資料を読みます。 だから、私はフィールドの比較(違いだけでなく、重複)に焦点を当てて、コンピュータビジョンと画像処理フィールドの定義に興味があります。 さらに、(概念的または既存の)実用的なアプリケーション、プロジェクト、および処理/活用の例を示すことは有益だと思います。 単独(またはほとんど)のコンピュータービジョンツールとアイデア 単独で(またはほとんど)画像処理ツールとアイデア 両方の分野のツールとアイデアの組み合わせ どちらがもう一方ではなく、どちらになるのか、または両方になるのかに特に注意。 これらのフィールドは非常に関連性があり、「線」はこの質問が求めているほど明確ではないかもしれないことを理解していますが、この質問のポイントは分類するための単純な決定ルールを設計することではないことを理解してください(私の)むしろ、これらの分野の焦点と目標のより良い理解。また、特に質問していなくても、質問の調子で話題になっているような追加情報を歓迎します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.