タグ付けされた質問 「image-processing」

一般に、画像処理は、写真やビデオフレームなどの入力が画像である信号処理の任意の形式です。

1
Opencv calcHistおよびcalcBackProject
画像処理について学びたいので、c ++とopencvの実験を始めました。 今、私の最初の演習は、calcHistとcalcBackProjectを使って皮膚検出器を作成することです。 しかし、私はいくつかのことを理解していません: バックプロジェクトの統計的解釈、および「バックプロジェクト」と呼ばれる理由 私はパラメータがどの範囲にあるのかをかなり理解していますcalcBackProject。しかし、私は本当にcalcHist機能の範囲パラメーターで立ち往生しています。 検出精度を上げるには、より多くのレベルでバックグロジェクションを使用するのが良いと思います。RGBの各チャネルとHSVの各チャネルで。しかしcalcBackProject、rgbとhsvの別々のチャネルの異なる結果をどのように組み合わせることができるかわかりません。 そして、私がうまく理解していないのは、これらの2つの方法で何をしているのかについての理論の欠如が原因だと思います(最初のポイントを参照)。分かりやすい英語で説明してください。

3
クロマサブサンプリング:データレートを適切に計算する方法
たとえばY'UV画像でクロマサブサンプリングを利用するときにデータレートを計算する方法を理解するのに苦労しています。 以下の計算例があります。 画像解像度:352*288 周波数:25 fps 以下のために(:4:4 4)以下のように計算例を行きます: (352px * 288px) * 3 color channels * 25 fps * 8 bit = 60 825 600 bit/s ここまでは順調ですね。 しかし、今来る(4:2:0): (352px*288px) * 1.5 color channels * 25 * 8 = 30 412 800 bit/s さて、この例を例(4:1:1)に変換しようとすると、1.5カラーチャネルの比率がどのように計算されるかを正しく理解しているかどうかわかりません。 計算の最初の推測は(4:2:0)の場合でした: 2/4*3=1.5 color channels 同様に(4:1:1)の場合、カラーチャネルの比率を次のように計算します。 1/4*3=0.75 color channels …

1
これらの曲線に最も厳密にフィットさせるには、どの補間方法を使用できますか?
私は、およびのように特定の領域が手でマークされている脳のMRI画像を使用しています。 私は、このような曲線を記述できる補間関数を考え出そうとしています。そのため、機械学習技術を使用して、やのようなマークされていない画像にそのようなマークを自動的に生成できます。 3次スプライン補間を使用して曲線を近似することを検討しましたが、私の知る限り、曲線を複数の部分に分割して補間する必要があります。 私は正しい軌道に乗っていますか、これを行う他の(より良い?)方法はありますか?


1
ビデオカードで採用されているアンチエイリアスアルゴリズムとは何ですか?
たとえば、人が話すときにビデオカードが使用するアルゴリズムは何8xAAですか?アルゴリズムは補正のために隣接するピクセルを調べることに関するものだと思いました。しかし、実装はアップサンプリングとそれに続くダウンサンプリングだけであると聞いています。

2
ハーレットの説明
誰かが私にいくつかの情報やリンクなどを与えることができるだろうか... ハーレット別名ハールウェーブレットのような機能に関する。私は修士論文のためにいくつかの論文を読んでおり、これらの論文のいくつかはハーレーについて簡単に述べています。私はそれらが何であるか、そしてそれらがどのように使用されるかを本当に理解することができないようです。これが基本的な質問である場合は、お詫び申し上げます。しかし、私はこの件について明確で構造化された情報を本当に感謝します。

1
スケール空間理論の理解
スケール空間理論の信号のスケール空間表現、(画像の場合には、D = 2)のように与えられる: L (X 、y ; t )= g (x 、y ; t )∗ f (x 、y )ここでg (x 、f(x),x=(x1,...,xd)f(x),x=(x1,...,xd)f(x), x = (x_1, ..., x_d)d=2d=2d = 2L(x,y;t)=g(x,y;t)∗f(x,y)L(x,y;t)=g(x,y;t)∗f(x,y)L(x, y; t) = g(x, y; t) * f(x, y)はパラメーター tのガウスカーネルで、 *はたたみ込みです。tパラメータを変更することにより、多かれ少なかれ平滑化された画像を受け取ります。その結果、粗い表現(パラメーター t)には小さなオブジェクトやノイズが含まれなくなります。g(x,y;t)g(x,y;t)g(x, y; t)ttt∗∗*tttttt 主なポイントは、スケール不変の特徴検出の方法を見つけることですよね?そのため、一部の画像のサイズが縮小された場合、他のノイズキーポイントを見つけることなく、キーポイントなどの機能がサイズが異なっていても正しく検出されます。 この論文では、彼らは正規化導関数を使用しています。 δ ξ 、γ - N 、O …

1
小さなシフトとスケールに不変のデータ分解方法?
次元を減らすために射影行列を推定するが、同じクラスからの元のデータのスケール、シフト、および回転がわずかに異なる場合に、ユークリッド距離の項で類似のベクトルを遠くに射影しない固有値に類似したデータ分解方法はありますか(2D場合)。 y= Ex ;y=Eバツ;y = E x; 例えば、ECG分類問題の例。有酸素運動の周期は異なります。さらに、スケールとシフトはビート検出の精度に依存します。したがって、同じクラスに属する循環器は、その変動のために遠くに投影される可能性があります。

2
画像処理-核を数える
私はそのような画像の核の数を数えることができるプログラムを作成しようとしています: 私がすでに行っているのは、次のステップバイステップです: 交互順次フィルターを適用します(徐々に大きくなる構造化要素で画像を閉じて開く) 距離変換を適用する 距離変換画像を使用して流域セグメンテーションを適用して最小値を検出する 次の結果が得られます(各色はカウントされた新しい中核を表します)。 ご覧のように、多くの欠陥、特に過剰に計算された核があります。この問題の理由は、ウォーターシェッド変換に(距離変換を使用して)最小値を課す方法にあると思いますが、その場合、最小値を課す他のアイデアはありません。 距離変換はオブジェクトの丸みに基づいて最小値を生成するので、核を切り上げるための代替シーケンシャルフィルターよりも優れた代替策を知りたいです(上の画像を見ると、「過カウント」のほとんどは、丸みの少ない核)。また、Watershed Transformに最小値を課すより良い方法を知りたいです。

1
画像から汚れを取り除く方法は?
非常に歪んで汚れた画像があります この汚れを取り除くことはできますか?画像修復は役に立ちますか? 助けてください 編集:別の画像 異方性拡散を適用し、imagesc(MATLAB)でイメージを表現した後 修復を試みましたが、結果は十分ではありません とにかくこの出力を改善できますか?

2
Log-Polar DFTベースのスケール不変の画像登録
Reddy Chatterjiの論文に記載されているように、位相相関を使用して画像のレジストレーションを行おうとしています。私の場合、画像は相対的にスケーリングおよび変換されます。 私が理解しているように、相対スケールを見つけるアルゴリズムは次のとおりです(参照:論文のフローチャート)。 F1 = DFT(I1) F2 = DFT(I2) H1 = Highpass(F1) H2 = Highpass(F2) L1 = LogPolar(Magnitude(H1)) L2 = LogPolar(Magnitude(H2)) PC = PhaseCorrelate(L1,L2) PM = norm(PC) R = IDFT(PhaseCorr/PM) P = Peak(R) Scale = LogBase^P[1] スケールは一見無意味な値を与えます(画像ごとに大きく異なり、決して修正されません)。 しかし、スケールを無視すると、同じ位相相関アプローチが変換にうまく機能します。ですから、対数極変換に問題があるのではないかと思います。これは私が翻訳のために解決した例です-左の画像はオリジナルで、右はトリミングされて翻訳されています-ソリューションは元の画像の上に表示されています: 対数極座標変換のために、私は第一極空間への変換 私^(ρ 、θ )= I( R + ρ COS(2 πθNθ)、 R - …



2
指先や爪を検出するためのアルゴリズム
画像の指先/爪の検出に使用するのに最適なアルゴリズムは何かについてアドバイスをいただけますか。最初に気が付いたのはビオラ・ジョーンズでした。再考した後、エッジ検出を適用した後にヒュー変換のみを使用することが可能である可能性があると結論付けました。しかし、もう少しアドバイスをお願いします。また、これは学習を目的とした学生のプロジェクトになるため、OpenCVまたは同様のフレームワークを使用することは許可されていません。以下は、処理される典型的な画像です。(トップダウンビューではないことに注意してください)。親指を検出する必要はありません。 典型的な画像http://www.deviantpics.com/images/BwgPX.jpg

1
第2世代ウェーブレットのチュートリアル(リフティングあり)?
一部のノイズ除去とデコンボリューションの実験では、第2世代のウェーブレット変換を適用します(リフティングステップ)を画像ます。 私はいくつかの実装が利用可能であることを知っていますが、それらのほとんどはmatlabを使用していますが、OpenCVを使用してC ++で作業したいと思っています。OpenCV 2.xには組み込みウェーブレット変換の実装がないため、自分で実装する予定です(さらに、私にとっては良い練習になります)。いくつかの調査の後、第2世代の変換に関する元の記事を見つけることができましたが、アルゴリズムの正確な動作についてはまだ少し混乱しています。 Sweldensによる論文[1]を主に参照すると、リフティングスキーム:第2世代のウェーブレットの構築ですが、インデックスセットの定義にはまだ混乱しています。彼らはどのように構築されていますか?...K(j)K(j)\mathcal{K}(j) したがって、私の質問:チュートリアルのような形式であるか、(数学的なものではなく)よりアルゴリズム的なビューを提供する、第2世代ウェーブレット変換に関するいくつかのリソース(論文、チュートリアル、スライド...)について誰かが知っていますか?、それは私自身の実装を設計するのに役立ちますか? 前もって感謝します。 参考文献 私の主な参照は: [1] Sweldens、W.(1998)。リフティング方式:第2世代のウェーブレットの構築。SIAM Journal on Mathematical Analysis、29(2)、511。 また、私は次のことからも学びます。 [2] Daubechies、I.、&Sweldens、W.(1998)。因数分解ウェーブレットはリフティングステップに変換されます。Journal of Fourier analysis and applications、4(3)、247–269。 [3] Kovacevic、J。、およびSweldens、W。(2000)。任意の次元で昇順のウェーブレットファミリー。画像処理、9(3)、480–496。doi:10.1109 / 83.826784

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.