信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

4
方法:画像内のピクセルパックから代表的なポイント座標(x、y)
左側の次の図に示すように、画像(グレースケールまたはバイナリ)があるとします。目標は、ポイントのリスト、つまり(x、y)の形式の座標のリストを生成することです。画像の暗いピクセル。 これを行うための適切な画像処理ツールは何ですか?それらはどこで利用できますか? 更新: 1) ここでは、問題の詳細を確認できます。(パックのサイズの違いに注意してください) それぞれの凸包境界を計算するパックを検出してから、代表的な重心を見つけることをお勧めします{詳細はこちらを参照}。 2) 以下は、距離変換(「Libor」が推奨)を適用した結果です。図の注釈に注意してください。この方法は有望だったため機能しません! 3) 侵食は小さなパックを排除します! from __future__ import division from scipy import zeros, ndimage as dsp from pylab import subplot,plot,matshow,show img = zeros((30,30)) img[10:14,10:14] = 1 img[16:17,16:17] = 1 img[19:23,19] = 1 img[19,19:23] = 1 subplot(221) matshow(img,0) subplot(222) y = dsp.binary_erosion(img,[[1,1],[1,1]]) matshow(y,0) subplot(223) y = …

2
低MIPSビデオエンコーダ
低MIPS、低圧縮のビデオエンコーダーを探しています。これは、10fps、VGAタイプの品質の圧縮用です。私のオプションは何ですか?浮動小数点をサポートする1​​50MHz ARM M4 CPUを使用してこの圧縮を実行できるようにする必要があります。(STM32F4)。 私の考えは、この圧縮データを並列バスでCPUから押し出すことです。データに対して処理は行われません。圧縮率に関しては、できる限り境界を確認したいと考えています。これは低コストのCCTVアプリケーション用です。5USDのCPUと多くの伝送帯域で、低データ伝送帯域幅の30USDエンコーダーで何ができるかを知りたいです。 10fps、VGAは約25Mbit /秒のデータを生成します。これは、そこにあるものにとってはかなり高いデータレートです。これを5Mビット/秒に下げることができれば、非常に低コストのCCTVシステムを構築できると思います。データをベースに取得したら、データを再エンコードできます。そのため、非常に損失が少ない限り、圧縮メカニズムが何であってもかまいません。 単色ビデオは、色よりも今必要なものです。 更新 このCPUには、このタスクに120MHzが割り当てられています。 メモリインターフェイスは16ビットであるため、外部メモリの書き込み/読み取りは内部メモリに比べて遅くなります。 内部メモリは120KByteで、32ビットアクセスの高速アクセスがあります。どちらの場合も、メモリはAHBバスを介してアクセスされ、クロック周波数として60MHzを想定する必要があります。 次のデータフローが予想されます。 カメラ-> DMA->外部メモリ(CPUの関与なし) 外部メモリ-> CPU->圧縮->内部メモリ 内部メモリ-> DMA->データバス->外部デバイス CPUは、データ圧縮のチャンクを読み取り、その内部メモリ(圧縮データ)に書き込むだけで、後でDMA転送を開始します。

1
opencvを使用してGUIの要素を検出するにはどうすればよいですか?
アプリケーションのスクリーンショットが与えられた場合、opencvのみを使用してそのアプリケーションのGUI要素を見つける方法はありますか?(画像のようなもの) opencvインストールフォルダーにあるcoherence.pyサンプルの画像とその他の効果をブレンドして遊んでみました。実行可能な結果を​​得ることに成功しませんでした。 誰かこれをしましたか?私が何をしようと思っているのか分かりますか? ありがとう (私はopencvと画像処理が初めてなので、可能な場合は明確な説明を避けないでください):)

1
単純な画像に使用できるセグメンテーション方法は何ですか?
私が現在携わっているプロジェクトに関連して、自分のイメージを「セグメント化」するのに役立つ可能性があることが1つあることに気付きました。そのために、以下に非常に簡単な例を示しました。 セグメンテーションメソッドは一般的にどのように機能し、どのクラスが最初のイメージから私を導くのに役立ちますか: ...秒に: ここで発生したと思われるスケーリングを無視してください。

2
Matlabを使用して画像をセグメント化するために流域を適用する方法は?
流域を使用してこの画像をセグメント化して、画像内の人物のみを取得する方法は? これまでに次のことを行いました。 勾配を計算しました 流域変換を計算しました 私のコード: clear; I=imread('inpaint.jpg'); I=rgb2gray(I); hy = fspecial('sobel'); hx = hy'; Iy = imfilter(double(I), hy, 'replicate'); Ix = imfilter(double(I), hx, 'replicate'); gradmag = sqrt(Ix.^2 + Iy.^2); figure, imshow(gradmag,[]), title('Gradient magnitude (gradmag)') L = watershed(gradmag); % Lrgb = label2rgb(L); figure, imshow(L), title('Watershed transform of gradient magnitude (Lrgb)') 流域の適用に成功しました …

2
この色変換の名前は何ですか?
これは画像の色変換に関する質問です。RGB画像を名前がわからない色空間に変換するために使用しているこの色変換マトリックスがあります。 T = [(1/3) (1/3) (1/3); (1/2) 0 (-1/2); (-1/2) 1 (-1/2)] この色変換の名前は何ですか?KLトランスフォームと呼ばれるものをどこかで見たことがあると思いますが、それは画像の大規模なコレクションに対して計算されたKLTに近いためです...


1
各ステップでD4ウェーブレット変換を「正規化」すると、最終的な画質が低下します
元の画像: (含まれている画像は.png画像であるため、表示用の保存/アップロードに追加の歪みは追加されていません) 私は「数学の波紋」の 20ページからD4変換を使用しました。これは基本的に次の5つのステップです。 フォワードd4: c1 = √3 / 4.0 ; c2 = (√3 - 2) / 4.0 ; s[ IEVEN ] += √3 * s[ IODD ] ; s[ IODD ] -= c1*s[ IEVEN ] + c2*s[ IPREVEVEN ] ; s[ IEVEN ] -= s[ INEXTODD ] ; s[ …
7 noise  wavelet 

1
情報理論-チャネル容量の単位
情報理論の最初のコースでは、チャネル容量の運用上の解釈が導入されたとき、それは信頼できる通信の最高のデータレート(ビット/チャネル使用)であると言われています。いくつかの論文を読んでいるときに、ビット/秒/ Hzの単位で表現されているチャネル容量に遭遇しました。そこで、2つのユニットの接続について考えていたところ、次のような説明がありました。これが間違っている場合はお知らせください。 帯域制限されたチャネルの場合(帯域幅= WWW Hz)、あなたはで送信することができます 2 W2W2Wナイキストサンプリング定理による記号/秒。したがって、「帯域幅あたり」のレート(スペクトル効率)は、2シンボル/秒/ Hzとして記述できます。各シンボルが1ビットの場合、各サンプルで1ビットを送信しています。では、1ビット/チャネルの使用は2ビット/秒/ Hzに相当しますか? 「チャネル使用」とは何ですか?

3
フーリエ級数表現
概念的には、たとえばパルス列などのペリロイドシリーズを表現する場合、フーリエ係数を見つけて、時間領域での表現を取得します。 しかし、それを表すために時間シフトされたrect関数の無限の合計を使用することで概念的に何が間違っているのでしょうか? 申し訳ありませんが、フォーマットの問題があったため、これを下部の投稿に追加します... 私の方法はそのようなものです: 我々は周期的なパルス有すると仮定するとなるように用とのために、したがって、の周期はです。x (t )x(t)x(t)x (t )= 1x(t)=1x(t) = 10 &lt; t &lt; T0&lt;t&lt;T0 < t< T000T&lt; t &lt;TpT&lt;t&lt;TpT < t < T_px (t )x(t)x(t)TpTpT_p 次の方法でフーリエ係数Ckを見つける: Ck =1Tp∫∞- ∞x (t )∗e- jの2 πk tTpCk=1Tp∫−∞∞x(t)∗e−j2πktTpCk = \frac{1}{T_p} \int_{-\infty}^{\infty} x(t) * e^\tfrac{-j2\pi kt}{T_p} 1周期を超えるため、x(t)を次のように表すことができます。 x (t )=ΣkCkeJ 2 πk tTpx(t)=∑kCkej2πktTpx(t) …
7 homework 

2
2つの類似した脳波信号をどのように区別できますか?
非常によく似た2つのEEG信号があります。違いは振幅のみです。しかし、それらは2つの異なる認知プロセスから来ています。統計情報に関して2つの非常に類似した信号を区別するために、FFT以外にいくつかの方法は何ですか?私にお知らせください。ありがとうございました BSS。

1
OpenCVを使用して画像内のエッジの長さ/方向のヒストグラムを取得する
ROIに[日本語]のテキストが含まれているかどうかを推定する過程で、長さや方向によってビニングされたエッジの大まかな数を取得する必要があります...これにより、 ROIにはテキストが含まれている可能性があります。 ただし、そのようなヒストグラム(または特定の長さ/向きのしきい値のエッジの数)を取得するための効率的な(これは最終的にはビデオストリームで機能する必要があります)方法を理解できないようです。ハフ変換は、 CannyとSobelはすべてのタイプを検出しますが、特定の形状(ラインなど)に焦点を合わせますが、それらの出力は特にカウントに役立ちません... 画像からエッジのリストをすばやく抽出するために、使用できるいくつかのアルゴリズムについての提案やヒントをいただければ幸いです...

1
ウィンドウ付き画像スケーリングフィルターで最適なタップ数をどのように選択しますか?
フィルターを使用して画像を拡大縮小しようとしていますが、ほとんどの場合、機能しているように見えます。しかし、今は最適なタップ数のフィルターを生成できるようにしたいと思います。一般的に、タップ数が多いほど良いことを知っています。ただし、タップを1回追加するごとに画像の品質がどの程度向上するかについては、利益が減少しています。それでは、実装の複雑さと画質の間の適切なトレードオフとなるタップ数を選ぶにはどうすればよいでしょうか。いくつかの「理想的な」フィルターに対して異なるフィルターを評価できる標準測定はありますか? これについてもっと考えると、これは本当に2つの質問だと思います。1つは、使用するウィンドウ化されたsincを決定することです(この場合、既にlanczos2または3を使用することに決めています)。これは、アプリケーションに応じてさまざまなトレードオフを持つより一般的な質問です。しかし、その決定が行われると、タップ数は簡単に決定されます。lanczos2の場合、理想的なタップ数は4であり、lanczos3の場合、理想的なタップ数は6です。これが5または7ではない理由は、ウィンドウ処理により、これらのタップの1つが常にゼロになるためです。 より一般的なケースでは、特定のウィンドウに必要なタップ数を簡単に示す方法は、次のように言うだけです。 taps = max - min lanczos2の場合、最大値は2で、最小値は-2です。したがって、タップ= 4。

2
画像処理-勾配領域とは何ですか?
勾配領域とは何ですか?ラプラスのピラミッドと関係がありますか? 私はあなたがそれが何であるかを知っていてそれを定義していないと仮定して記事だけを見つけました、誰かがそれが何で何のためにそれが使われているのか定義できますか? 使用されているリファレンスは、グラデーションドメインでのシームレスな画像合成です。

2
MOD-N循環たたみ込み
2つのシーケンスおよび MOD-2循環たたみ込みを見つける方法。h=[−1,3,−2,1]h=[−1,3,−2,1]h =[-1,3,-2,1]x=[1,−1,−2,1,3,2,1,2]x=[1,−1,−2,1,3,2,1,2]x = [1,-1,-2,1,3,2,1,2] 私は答えがmatlabからことを知っていますが、グラフィックまたは数学的にそれを見つける方法がわかりません777 000

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.