タグ付けされた質問 「image-processing」

一般に、画像処理は、写真やビデオフレームなどの入力が画像である信号処理の任意の形式です。

8
DSPまたは信号/画像/データ処理のジョーク
他のStackExchange / StackOverflowサイトには、一定レベルのユーモアや楽しみがあります。 お気に入りの「データ分析」漫画は何ですか?因果関係と相関関係に関するこのxkcd漫画(IMHO)に特に言及する価値があります(DSPの人々は私が言っていることを知っています)。 だから、ユーモアが答えでは許可されていますか?私はそう願っています、例えばse: StackOverflow:あなたの最高のプログラマーの冗談は何ですか? MathOverflow:良い数学ジョークが存在するか SE.Stats(検証済みクロス):統計ジョーク SE.Stats(Cross Validated):お気に入りの「データ分析」漫画は何ですか? SE.Maths 数学のジョークに関する質問 信号処理または画像処理のユーモアは存在しますが、浅く狭い範囲にあります。トルコのイスタンブールで開催されたICASSP 2000 DSPユーモア展で、私は最初に(以前はユーモアがなかった)それに遭遇しました。以下の画像は、EURASIPのDSPのユーモアからのものです。 だから私たちはいくつか値すると信じているhumorとjoke、タグと実際の明るさを。どうぞ!


4
上からの人の検出
私は、地上3メートルのカメラを1つだけ使用して、人を検出する方法を見つけようとしています。これはカメラによって返されるフレームです: 更新:ビデオテスト-> http://dl.dropbox.com/u/5576334/top_head_shadow.avi そのためには、まず、バックグラウンドとフォアグラウンドのセグメンテーションを実行する必要があることを理解します。それは簡単な部分です。 前景マスクを使用すると、ハフ変換などの簡単な操作で円を見つけることができますが、この方法では、多くの誤検出を含む頭部の60%しか検出されません。 色分けのような他の簡単なテクニックを使用することもできますが、髪型、色、髪の量などのために、人々の頭は上とは大きく異なることがわかりました... 私がそれについて持っている他のオプションは、HOG記述子、またはHaarのような機能を使用する可能性ですが、モデルを訓練するには上から見た人々の広範なデータベースが必要です。私はそのようなものを見つけていません。 これは非常に頻繁に起こる問題だと思っていましたが、文学やインターネットではあまり見つけることができません。このタスクを解決するための助けをいただければ幸いです:-) 更新:詳細については、目標は歩行者の流れを追跡するための一般的な方法を実装することです。最初のプロトタイプはモールでテストされます。

2
グリッドのような構造を検出するためのハフ変換の代替
私はグリッド形状を形成する複数の「角度」で構成される画像を持っています: いくつかの検索の後、ハフは行の区切りに悩まされていないため、ぴったりのように見えました。ただし、私が抱えている問題は、線が「太っている」ことであり、実行するエッジ検出(この場合はCanny)は、中央ではなく線のエッジを選択します。 これは、ハフ変換が、中央ではなくグリッド線の「側面」の一方(または両方)を選択することを意味します。 私が探しているもの(このグリッドのような形状、常にほぼ同じ方向)を知っているので、「エッジ検出」部分を実行して中心線を与えるより良い方法がありますか、または探しているべきですか?全く異なる方法で?

4
圧縮センシングの適用性
私が聞いたことから、圧縮センシングはスパース信号に対してのみ利用できます。これは正しいです? その場合、スパース信号と帯域制限信号をどのように区別できますか?すべての信号は、その場合にスパース信号になるよりもスパースまたはゼロ係数の信号部分を含むように拡張できますか? また、圧縮センシングは常に情報または信号を完全に取得しますか? 追加:ところで、私はこれらのことを学び始めたばかりなので、この質問の目的はこれらのことを少し味見することです。

2
強度レベルの深さに基づく画像の3D再構成?
オブジェクトがビューアーからどれくらい離れているかに基づいてオブジェクトをセグメント化する方法はありますか? 色の値はこの種のことを私たちのために評価できますか?強度レベルは、オブジェクトが視聴者からどれだけ離れているかを判断するのにどのように役立ちますか? 別の画像:

2
優れたオープンソース(無料)手書きOCRプログラムはありますか?
タイトルはそれをすべて求めます。私の前にはあまり熱心ではないデータ入力タスクがあります:50-100ページの手書きサインアウト/サインインログ。 ログの形式が役立つ場合があります。ページは明確に区切られた行と列に分割されます(13r x 6cに追加のヘッダー行があります)。さらに役立つのは、3つの列が日付/時刻に関連していることです(日付、タイムアウト、入力)。また、2つの列(リソースと名前)のデータは多かれ少なかれ列挙されるので、たとえば、同じ手書き文字で名前列に「Smith」という名前が何度も​​現れることがあります。最後の列「Notes」は自由形式ですが、前の6列を自動化できれば、Notesを手入力することは気にしません。 助言がありますか?(「入力を開始する」以外に) PSこれを尋ねるより良いSEサイトがあれば、私に知らせてください、私はそこで尋ねます。

2
これら2つのガボールフィルター関数の違いは何ですか
私のプロジェクトでは、背側の手の静脈画像で静脈の可視性を高める必要があります。2つの異なる偶数対称ガボールフィルターバンクを使用して、静脈の視認性を向上させます。 最初のバンクは次のガボール関数で構成されます: Gem k(x 、y)= γ2個のπσ2exp{ −12(xθ+ γ2y2θσ2)} ×( cos(2 πf0バツθ)− exp(- υ22))Gmke(x,y)=γ2πσ2exp⁡{−12(xθ+γ2yθ2σ2)}×(cos⁡(2πf0xθ)−exp⁡(−υ22))G^\mathit{e}_\mathit{mk}(x,y)=\dfrac{\gamma}{2\pi\sigma^2}\exp\Bigg\{-\frac{1}{2}\left(\dfrac{x_\mathit{\theta}+\gamma^2y_\mathit{\theta}^2}{\sigma^2}\right)\Bigg\}\times \left(\cos(2\pi f_\mathit{0}x_\mathit{\theta})-\exp(-\dfrac{\upsilon^2}{2})\right) 2番目の銀行は次のもので構成されます。 Gem k(x 、y)= exp{ −12(xθ+ γ2y2θσ2)} ×cos(2 πf0バツθ)Gmke(x,y)=exp⁡{−12(xθ+γ2yθ2σ2)}×cos⁡(2πf0xθ)G^\mathit{e}_\mathit{mk}(x,y)=\exp\Bigg\{-\frac{1}{2}\left(\dfrac{x_\mathit{\theta}+\gamma^2y_\mathit{\theta}^2}{\sigma^2}\right)\Bigg\}\times \cos(2\pi f_\mathit{0}x_\mathit{\theta}) ここで、スケールインデックスであり、kは配向指数であり、fはθはフィルタの中心周波数であり、σは、標準偏差(しばしば呼ばれるスケール)されるγは楕円ガウスエンベロープのアスペクト比で、υは DC応答を決定する要因であります、X θ = (X のcos θ + Y のsin θ )とY θ = (- X sinがθ + Y のcos θ )の回転バージョンであるXmmmkkkfθfθf_\thetaσσ\sigmaγγ\gammaυυ\upsilonバツθ= (x cosθ …

1
画像からグレアを除去する
免責事項:私は信号処理に従事していません。とても好奇心が強い... Nyの質問は、非常に簡単です。画像にソフトウェア処理を適用して、ヘッドライトのまぶしさを除去または軽減することは可能ですか? 次のような写真になります。 これが可能な場合、これに使用できるソフトウェアライブラリはありますか?どの言語でもかまいません。機能だけが必要です。これに関する現在の研究があるかどうか、誰もが知っていますか?

2
画像ノイズ低減用のウィナーフィルター(画像ノイズ除去)
私は、イメージノイズを低減するために、ウィナーフィルターの動作を頭で確認しようとしています。私の場合、最初に別のノイズ低減フィルターを使用してから、この結果をウィナーフィルターのノイズ特性の近似値として使用します。 Wienerフィルターに関する情報に関して、次のMatlabコードと説明が役立つことがわかりました。 http://www.mathworks.co.uk/help/toolbox/images/f11-12251.html#f11-14272 などのいくつかの他の良いリンク http://blogs.mathworks.com/steve/2007/11/02/image-deblurring-wiener-filter/ したがって、Matlabの観点から、組み込みのMatlab関数の使用方法を見ることができますが、関数呼び出しを使用するだけでなく、より基本的な理解を得たいと思いますが、同時に、より消化しやすいものを見つけたいですウィナーフィルタリングに関するウィキペディアのエントリ。 Wienerフィルタリングについて簡単に説明したい人はいますか?

3
輪郭の一致-輪郭の変位を見つける
同じオブジェクトの2つの画像で輪郭を見つけ、このオブジェクトの変位と回転を見つけたいです。私はこの輪郭の回転した境界ボックスとその角度と中心点を試しましたが、境界ボックスの回転は、角度a + 0、a + 90、a + 180などで同じであるため、輪郭の回転を正しく認識しません度。輪郭の回転と変位を見つける他の良い方法はありますか?たぶん凸包、凸欠陥のいくつかの使用?等高線のマッチングについてOpenCvの学習で読みましたが、助けにはなりませんでした。誰かが例を挙げることができますか? 例: たとえば、ピンクの四角や、2番目のケースのペンを検出したい。他の例は、いくつかの穴や星などのある正方形です。私が言ったように、私はいくつかの普遍的なものを作りたいです。可能な限り多くのメソッドをテストしたいので、提案はありがたいです。

3
ガボールフィルターは車のへこみの検出に使用できますか?
車のへこみを検出するためのガボールフィルターに関する研究を行っています。Gaborフィルターは、パターン認識、指紋認識などに広く使用されていることを知っています。 画像があります。 MathWorks File Exchangeサイトのコードを使用して、次の出力を得ました。 これは、どういうわけか期待される出力ではありません。これは良い結果ではありません。 私のスクリプトは次のとおりです。 I = imread('dent.jpg'); I = rgb2gray(I); [G, gabout] = gaborfilter1(I, 2, 4, 16, pi/2); figure imshow(uint8(gabout)); 編集:次の画像に異なるコードを適用します: ガボールフィルターのさまざまな方向の後の出力画像: 適切に検出されているこのDENTを分離するにはどうすればよいですか?

2
整数係数による画像のダウンサンプリング
整数係数で画像をダウンサンプリングする場合、明らかな方法は、出力画像のピクセルを入力画像の対応するブロックの平均に設定することです。n × nnnnn × nn×nn \times n この方法が最適ではないことをどこかで漠然と読んだことを覚えています(詳細は覚えていません) より良い方法があるというのは本当ですか?私は信号処理について多くを知りません、この質問はちょうど興味があります。

3
MPEGの予測コーディングでモーションベクトルはどのように機能しますか?
MPEGには、画像がマクロブロックに分割され、それらのマクロブロックごとに動きベクトルが計算されるプロセスがあります。次に、これらのベクトルを予測誤差とともに送信して、ビデオシーケンスの次の画像を再構築します。 これがどのように機能するかをしっかり把握しようとしています。各マクロブロックにはモーションベクトルが関連付けられており、(ベクトルが[1,0]のall the pixels in this block move 1 in the x direction and 0 in the y direction for the next frame. 場合)、すべてのモーションベクトルが正しく位置合わせされない場合、画像の領域が考慮されないままになることはありません(そのマクロブロックがそもそもあった)? たとえば、見つけた次の質問があります。 時間tでの次の画像を考えます。 7 7 7 7 7 7 5 5 7 5 5 8 8 8 8 8 9 9 9 9 9 9 9 9 …


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.