タグ付けされた質問 「hough-transform」

8
Python / SciPyのピーク検出アルゴリズム
一次導関数などのゼロクロッシングを見つけることで自分で何かを書くことができますが、標準ライブラリに含めるには十分に一般的な関数のようです。誰か知ってる? 私の特定のアプリケーションは2Dアレイですが、通常はFFTのピークを見つけるためなどに使用されます。 具体的には、これらの種類の問題では、複数の強いピークがあり、無視すべきノイズだけが原因で発生する多数の小さな「ピーク」があります。これらは単なる例です。私の実際のデータではありません: 1次元ピーク: 2次元ピーク: ピーク検出アルゴリズムは、これらのピークの位置(それらの値だけでなく)を見つけ、理想的には、おそらく2次補間などを使用して、最大値のインデックスだけでなく、真のサンプル間ピークを見つけます。 通常、気になるのは数個の強いピークだけなので、特定のしきい値を超えているため、または振幅でランク付けされた順序付きリストの最初のn個のピークであるために選択されます。 私が言ったように、私はこのようなものを自分で書く方法を知っています。うまく機能することが知られている既存の関数またはパッケージがあるかどうかを尋ねています。 更新: 私はMATLABスクリプトを翻訳しましたが、それは1次元の場合にうまく機能しますが、もっと良いかもしれません。 更新された更新: sixtenbe は1-Dケースのより良いバージョンを作成しました。

8
写真の紙の角を検出するアルゴリズム
写真の請求書/領収書/用紙のコーナーを検出する最良の方法は何ですか?これは、OCRの前に、後続の遠近補正に使用されます。 私の現在のアプローチは: RGB>グレー>しきい値付きキャニーエッジ検出>膨張(1)>小さいオブジェクトの削除(6)>境界オブジェクトのクリア>凸領域に基づいて大きいブログを選択 > [コーナー検出-実装されていません] このタイプのセグメンテーションを処理するには、より堅牢な「インテリジェント」/統計的アプローチが必要だと思います。トレーニングの例はあまりありませんが、おそらく100枚の画像をまとめることができます。 幅広いコンテキスト: 私はプロトタイプにmatlabを使用しており、OpenCVおよびTesserect-OCRでシステムを実装する予定です。これは、この特定のアプリケーションで解決する必要がある多くの画像処理問題の最初のものです。だから私は自分のソリューションを展開し、画像処理アルゴリズムに慣れるようにしています。 アルゴリズムで処理したいサンプル画像は次のとおりです:挑戦したい場合は、大きな画像がhttp://madteckhead.com/tmpにあります。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) 最良の場合、これは次のようになります。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) ただし、他の場合は簡単に失敗します。 (ソース:madteckhead.com) (ソース:madteckhead.com) (ソース:madteckhead.com) 素晴らしいアイデアをありがとうございます。大好き! 編集:ハフ変換の進行状況 Q:ハフラインをクラスター化してコーナーを見つけるアルゴリズムは何ですか?回答からのアドバイスに従って、ハフ変換を使用し、ラインを選択し、フィルタリングすることができました。私の現在のアプローチはかなり粗雑です。私は、請求書が常に画像とずれて15度未満になると仮定しました。これが当てはまる場合、行に対して妥当な結果が得られます(以下を参照)。しかし、コーナーを推定するためにラインをクラスター化(または投票)するための適切なアルゴリズムについて完全に確信はありません。ハフ線は連続していません。そして、ノイズの多い画像では、平行な線が存在する可能性があるため、線の起点メトリックからの何らかの形または距離が必要です。何か案は? (ソース:madteckhead.com)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.