タグ付けされた質問 「computer-vision」

コンピュータビジョンには、シーンや画像の高度な理解と認識を形成するために、画像や高次元データを処理、分析する方法が含まれます。



10
ディープラーニングは画像処理/コンピュータービジョンを破壊しますか?
私は信号および画像処理、または多分コンピュータービジョン(まだ決定していません)の修士課程に登録することを楽しみにしており、この質問が浮上しました。 私の懸念は、ディープラーニングは特徴抽出と入力前処理をほとんど必要としないため、画像処理(または一般的な信号処理)を殺すことですか? 私はディープラーニングの専門家ではありませんが、他の手法のような特徴ベクトルの代わりに画像を直接取得する認識および分類タスクで非常にうまく機能しているようです。 画像処理技術を使用して、従来の特徴抽出+分類アプローチの方が良い場合はありますか、またはこれはディープラーニングのために死にかけていますか?

6
葉の静脈を分割する最良の方法は?
私は多くの研究をしており、葉の静脈を検出するのに使用できる適応しきい値や流域などの方法を見つけました。ただし、多くのノイズが発生するため、しきい値設定は適切ではありません。 私の画像はすべて灰色の画像です。緊急の助けが必要なこの問題を考慮しながら、誰がどのアプローチを採用するか提案してください 編集:元の画像 しきい値処理後 答えが示唆するように、私は次のエッジ検出を試みました キャニー 多すぎるノイズと不要な妨害 ソーベル ロバーツ 編集:もう1つの操作を試みましたが、次の結果が得られました。キャニーとアダプティブで試したものよりも良いですか?

5
点パターン認識
2つの異なるサイズのポイント(簡単にするために2D)の2つの異なるサイズを2つの異なるサイズの正方形に分散させると、問題は次のとおりです。 1- 小さいものから大きいものまでを見つける方法 2-次の図に示すように、発生をランク付けする方法についてのアイデアはありますか? 質問の簡単なデモンストレーションと望ましい解決策は次のとおりです。 更新1: 次の図は、調査中の問題のもう少し現実的なビューを示しています。 コメントに関して、次のプロパティが適用されます。 ポイントの正確な位置が利用可能です ポイントの正確なサイズが利用可能です サイズはゼロ(〜1)=ポイントのみ 白い背景にすべてのポイントが黒です グレースケール/アンチエイリアシング効果はありません 以下にendolith、いくつかの小さな変更を加えてで提示したメソッドの実装を示します(回転が小さくて高速なので、ソースではなくターゲットを回転しました)。以前にそれについて考えていたので、「endolith」の答えを受け入れました。RANSACについて私はこれまで経験がありません。さらに、RANSACの実装には多くのコードが必要です。


1
食品瓶のラベルの画像を平らにする方法は?
食品の瓶のラベルの写真を撮り、ラベルが平らになるようにラベルを変換できるようにしたいです。右側と左側が画像の中央に合わせてサイズ変更されます。 理想的には、エッジを見つけて補正を適用するために、ラベルと背景のコントラストを使用したいと思います。それ以外の場合は、ユーザーに画像の角と辺を何らかの方法で識別するように依頼できます。 私は、球状に(私の場合は円筒状に)歪んだ画像を撮影し、画像を平坦化できる一般的な手法とアルゴリズムを探しています。現在、瓶またはボトルに巻き付けられているラベルの画像には、画像の右または左に後退するにつれて縮小する機能とテキストがあります。また、ラベルの端を示す線は、画像の中央でのみ平行であり、ラベルの左右の端で互いに向かって傾斜します。 画像を操作した後、まるで瓶や瓶にないときにラベルの写真を撮ったように、テキストと機能が均一なサイズになっているほぼ完璧な長方形を残したいと思います。 また、適切な修正を適用するために、この手法がラベルの端を自動的に検出できれば、それが欲しいです。それ以外の場合、ラベルの境界を示すようにユーザーに要求する必要があります。 私はすでにグーグルで検索して、次のような記事を見つけました: カーブしたドキュメントを平坦化するが、シンプルなカーブのラベルが必要なため、もう少しシンプルなものを探しています。

7
画像内の正方形を見つける
OpenCVを使用して画像内の正方形を見つける必要があります(matlabやその他の問題はありません。一般的に、私はいくつかのアイデアを期待しています)。 以下のテスト画像を検討してください。 上の画像で色の付いた正方形を正確に見つける必要があります(白い長いストリップではありません)。 私がしたこと : 一般的な方法(OpenCVサンプルに付属)を適用しました。つまり、すべてのカラープレーンで輪郭を見つけ、近似し、要素数= 4をチェックします。いくつかの四角形、特に暗い四角形が検出されると、ある程度拡張されます。 次のステップは予測でした。すなわち、この配置は固定されています。そのため、いくつかが取得された場合、残りのものを予測できます。また、さらに拡張されました。しかし、精度は非常に悪かった。 しかし、ここでは予測は良い方法ではなく、最初のステップで与えられたように正確な答えを常に提供するとは限りません。 必要なもの: 1)これらの正方形をより正確に検出する他のより良い方法はありますか?または複数の方法? 1つの重要なポイントは、ここでは時間は問題ではないということです。アルゴリズムは遅くなる可能性がありますが、問題ではありません。しかし、精度が主要な基準です。 時々、画像がはるかにぼやけることがあります。 そして、私が直面した主要な問題の1つは、いくつかの正方形が背景の色とほぼ同じ色を持つことです(3列目の1番目と2番目の正方形を確認してください)。 アイデアを探して、事前に感謝します 更新: 以下は、私が得た最大の正確な結果です: もちろん、結果画像のサイズは少し変更されます。 更新2: 私は以下の回答でより良いソリューションを提供しました:https : //dsp.stackexchange.com/a/7526/818

2
ハフ変換とラドン変換の違いは何ですか?
私はCTスキャンについて学ぶことからラドン変換に精通していますが、ハフ変換については知っていません。ウィキペディアによると (r、θ)平面は、2次元の一連の直線のハフ空間と呼ばれることもあります。この表現により、ハフ変換は概念的に2次元ラドン変換に非常に近くなります。(それらは同じ変換を見る異なる方法として見ることができます。[5]) 彼らの出力は私には同じように見えます: Wolfram Alpha:ラドン Wolfram Alpha:ハフ だから私は違いが何であるか理解していません。それらは異なる方法で見られる同じものですか?それぞれの異なるビューの利点は何ですか?なぜそれらは「ハフ・ラドン変換」に結合されないのですか?

5
森林画像の軌跡の検出
森のシーンの画像で(トレイルに沿って立っているカメラの視点から)トレイルを特定するための研究/論文/ソフトウェアを知っている人はいますか? 私は次のような画像を取ることができるアルゴリズムを見つけようとしています: 次のような「トレイル」を特定するマスクを作成します。 ご覧のとおり、元の画像は少しぼやけており、意図的です。画像ソースは完全な焦点を保証することはできないため、適度な量のノイズとぼやけを処理できる必要があります。 私が最初に考えたのは、ガウスぼかしを適用し、画像をブロックに分割し、隣接するブロックを比較してシャープな色の違いを探します(トレイルの「エッジ」を示します)。しかし、私はすぐに、影や照明の他の変化が簡単にそれを放散することに気付きました。 私はSURFの特徴を抽出することを考えていましたが、画像が完全に鮮明で一貫した照明である場合にのみ、SURF / SIFTで成功しました。 また、画像とマスクをはるかに小さいサイズ(100x75など)に縮小し、1xNベクトルに変換し、それらを使用してFANNベースのニューラルネットワークをトレーニングしようとしました(画像は入力で、マスクが必要です)出力)。入力ベクトルの75%のサイズの1つの隠れ層があるこのような小さなサイズでさえ、トレーニングに6時間かかりましたが、それでもテストセット内のマスクを予測できませんでした。 誰もが主題に関する他の方法や論文を提案できますか?

5
コンピュータービジョンに適した言語ですか?
コンテンツベースの画像検索システムを実装しようとしていますが、その前に、このタスクに適したいくつかのプログラミング言語の概要を取得したいと思います(優れたライブラリなどを持っています)。 誰もその種のタスクのためのいくつかの良い言語とライブラリを知っていますか?PythonやJavaはどうですか? ベスト

3
航空写真でテニスコートを見つける方法
私は郡内のすべてのテニスコート(およびバスケットボールコートのような他の同様に明確に定義された機能)を見つけることに興味があり、良い(しかしさまざまな)解像度の航空写真を持っていますが、それらを見つける最良の方法はわかりません。画像の2つの例を次に示します。 さまざまな方法を見てきましたが、テンプレートマッチングは機能しないと思います。これは、任意のスケールと回転があり、色も異なるため、非常に遅いためです。ハフ変換有望な音を、私は、私は他のマークされた行を考慮するために、より良いまだ(36x29フィート程度)適切な比率で四角形を構成する行を検索するかわからない、またはすべての行を得れば。 背景として、郡内のすべてのテニスコートをOpenStreetMapに追加することを目指しています。

8
コンピューターステレオビジョン技術はサブミリメートル測定に適していますか?
私はオブジェクトを撮像し、この画像の特徴の高さをサブミリメートルの精度に導きたいプロジェクトを持っています(正確にはまだ正確にはまだ決定されていませんが、今のところ100分の1ミリメートルとしましょう) 。 私は、直接レーザー測距技術が適切でないことを以前にアドバイスされました 移動時間が短すぎるため、正確な計算を行うには精度が高すぎます マイナーな振動(装置の近くを歩く人など)は結果を混乱させます 私は約1000ドルで販売され、精度を達成できるが振動の問題に悩まされているレーザー装置を観察しました(これは問題ありません。装置を機械的に分離することも別の議論です)。 私は、より費用効果の高い結果を達成することを望み、ステレオビジョンを代替として考えました。この分野の初心者であるため、目的の精度を達成できるかどうかはわかりません。 (少なくとも)理論的には望ましい精度ですか? このトピックをさらに説明するのに役立つ推奨論文またはリソースはありますか? その他の注意事項 問題のオブジェクトは、約1/2 "正方形から約2 1/2"正方形までの範囲で、厚さが非常に薄い(1/16 "?)場合があります。機能はかなり荒いものになります(一般的に急激な移行)8月17日11:00 「より難しい」興味深いオブジェクトの1つは、高さ1.25mmの約20mmの正方形です。問題の表面特徴は、私が見積もっている.1-.3mmのオーダーです。カメラの位置は、おそらく上記の6インチのオーダーになります。これにより、より良い洞察が得られますか?8月17日15時15分 単一のプロファイル/レリーフ測定を実行するのではなく、オブジェクトの表面高さマップを生成しようとしています。全体的なプロファイルと同様に、オブジェクトの表面の特徴は非常に重要です。

4
植物顕微鏡画像で気孔を見つける
画像処理の専門家への質問です。 私は難しいコンピュータービジョンの問題に取り組んでいます。タスクは、DIC顕微鏡画像で気孔(以下にマーク)をカウントすることです。これらの画像は、モルフォロジー演算やエッジ検出など、ほとんどの表面的な画像処理技術に耐性があります。また、他のセルカウントタスクとは異なります。 OpenCVを使用しています。私の計画は、気孔の識別に役立つ可能性のある機能を確認することです。 テクスチャ分類子 DCT(離散コサイン変換/周波数領域分析) LBP(ローカルバイナリパターン) HOG(方向付けられた勾配のヒストグラム) 堅牢な特徴検出器(私は懐疑的です) ハリスコーナー SIFT、SURF、STARなど Haarカスケード分類器/ Viola-Jonesの機能 そして、おそらく新しい機能記述子を設計します。今のところ、分類子の選択は省略しています。 私は何を見逃しましたか?これをどのように解決しますか?同様のオブジェクト検出問題の解決策は非常に役立ちます。 サンプル画像はこちら。 バンドパスフィルター後: キャニーエッジの検出は有望ではありません。一部の画像領域は焦点が合っていません。

3
一連の画像から3D構造を再構築するにはどうすればよいですか?
次のようにグループ化された輪郭のセット(線分セットのセット)があります。 Si={I0,Iπ4,I2π4,…,I7π4}Si={I0,Iπ4,I2π4,…,I7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} どこで S私SiS_iは、1つの具体的なオブジェクトの写真のシーケンスを示します。 私jIjI^jは視点を持つ画像を表します(は正面図を意味します)。 j = 0jt hjthj^{th}j = 0j=0j=0 (背面図)の例を次に示します。 私πIπI^\pi 与えられたでオブジェクトの3D構造をどのように再構築できますか?S私SiS_i 誰かが私にいくつかの論文を教えてくれたり、キーワードを教えてもらえますか?ポイントクラウドなどで動作する多くの記事があることは知っていますが、線で動作しているため、それらは機能しません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.