信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

2
画像内の特定の行を見つける
次の図で、青色と灰色の間の線を見つけたい: より正確には、その線の終点。 ハフ変換は選択ですか?はいの場合、ハフを使用する前に画像をどのように設定すればよいですか? これを解決する方法があれば役に立ちます。

1
離散フーリエ変換-基本をすばやく見つける?
まず、私は謝罪します。私はソフトウェア開発者であり、純粋な数学に飛び込んでいないのは非常に長い期間なので、私の質問は馬鹿げているように見えるかもしれません。私は望みません。 コンテキストは、音楽のピッチ認識です。 音符を取り、それにフーリエ変換を適用すると、特定の周波数の振幅の合計が無限になります。たとえば、任意の楽器で基本がである音符を演奏すると、フーリエ変換後、F 、2 F 、3 F 、… 、n Fで高調波が発生します。すべての周波数には、楽器の音色を定義する特定の振幅があります(ピアノ、声、トランペットなどすべてはこの音に従いますが、すべての倍音に対して異なる振幅があります)。FFFF、2 F、3 F、… 、n FF、2F、3F、…、んFF, 2F, 3F,\ldots,nF 今私がしたいのは、与えられたオーディオ信号からです、見つけます。それだけ。常にバックグラウンドノイズなどがあるため、見た目よりも複雑です。さらに、Fは必ずしも最大の振幅を持つ周波数である必要はありません。FFFFFF したがって、を見つけるための私のアイデアは、DFT(実際には速度のFFT)を適用し、周波数Fを見つけることです。これにより、F + 2 F + 3 F + … + n FがFFT出力で最大になります。FFFFFFF+ 2 F+ 3 F+ … + n FF+2F+3F+…+んFF + 2F +3F + \ldots + nF それは可能だと思いますか?それは非常に短い時間で可能だと思いますか(<5ミリ秒としましょう)?
9 audio  fft  pitch 

1
大きいステップとの差を使用して信号の平滑化された微分を計算する=長方形ウィンドウでのたたみ込み
私はでサンプリングされた信号有しここで、i = 0..N-1。信号の1次導関数を求めたい:f '(t)。Δt:fi(ti=iΔt)Δt:fi(ti=iΔt)\Delta t: fi(ti=i\Delta t) 私の最初の考えは、これを中心的な違いによって推定することでした: f′(ti)=f(ti+1)−f(ti−1)2Δtf′(ti)=f(ti+1)−f(ti−1)2Δtf'(t_i) =\frac{f(t_{i+1})−f(t_{i−1})}{2\Delta t} ただし、信号には高周波ノイズが多く、f 'が急激に変動する可能性があります。私は、Hannなどのウィンドウ関数とのたたみ込みによって信号を平滑化し、その差から導関数を見つけるのが適切だと思います。 同僚は、微分の平滑化された推定値を見つけるより速い方法を提案しました:2n個のサンプルで中心差を使用します。ここで、n >> 1です。 f′(ti)=f(ti+n)−f(ti−n)2nΔtf′(ti)=f(ti+n)−f(ti−n)2nΔtf'(t_i) =\frac{f(t_{i+n})−f(t_{i−n})}{2n\Delta t} もちろん、これは最初にウィンドウ関数でたたみ込むよりも計算的に高速ですが、それは良い解決策ですか? 合計を計算する場合: S=2Δt[f′(ti−n+1)+f′(ti−n+2)+..+f′(ti+n−1)]S=2Δt[f′(ti−n+1)+f′(ti−n+2)+..+f′(ti+n−1)]S=2\Delta t[f'(t_{i-n+1})+f'(t_{i-n+2})+..+f'(t_{i+n-1})] ΔtΔt\Delta t S=f(ti−n+2)−f(ti−n)+f(ti−n+3)−f(ti−n+2)+..+f(ti+n)−f(ti+n−2)S=f(ti−n+2)−f(ti−n)+f(ti−n+3)−f(ti−n+2)+..+f(ti+n)−f(ti+n−2)S=f(t_{i-n+2})-f(t_{i-n})+f(t_{i-n+3})-f(t_{i-n+2})+..+f(t_{i+n})-f(t_{i+n-2}) 2つを除くすべての条件がキャンセルされます。 S=f(ti+n)−f(ti−n)=2nΔtf′(ti)S=f(ti+n)−f(ti−n)=2nΔtf′(ti)S=f(t_{i+n})-f(t_{i-n})=2n\Delta tf'(t_i) したがって: f′(ti)=1n[f′(ti−n+1)+f′(ti−n+2)+..+f′(ti+n−1)]f′(ti)=1n[f′(ti−n+1)+f′(ti−n+2)+..+f′(ti+n−1)]f'(t_i)=\frac{1}{n}[f'(t_{i-n+1})+f'(t_{i-n+2})+..+f'(t_{i+n-1})] したがって、2n個のサンプルの中央差を取ることは、最初にサイズ2n-2の長方形のウィンドウで畳み込み、次に+/- 1個のサンプルの中央差を取ることと同じです。 長方形のウィンドウで滑らかにするのはどのくらい「悪い」のでしょうか。 FFTを取得すると、「リンギング」が発生しますが、FFTを取得する必要はありません。 どんな答えも事前にありがとう!

1
波形の信号対雑音比を推定する方法は?
I信号を有する:、iは= 0 ... N - 1。f私(t私= I Δ T )f私(t私=私Δt)f_i(t_i=i\Delta t)i = 0 … n − 1私=0…ん−1i = 0\ldots n-1 信号は、ゆっくりと変化する「トレンド」を中心に急速に変化するようです。急速に変化する部分はノイズであり、ゆっくり変化する部分は実際の信号であると想定しています。 信号の信号対雑音比(SNR)をどのように推定しますか? :私はtreshold周波数を決定することができればという思い、私は次の式を使用できます。ωtωt\omega_t Fはフーリエ変換を示し、F(T)。S/ N= ∫ωt0| F(ω )|2∫∞ωt| F(ω )|2S/N=∫0ωt|F(ω)|2∫ωt∞|F(ω)|2S/N=\frac{\displaystyle\int_0^{\omega_t}|F(\omega)|^2}{\displaystyle\int_{\omega_t}^{\infty}|F(\omega)|^2}FFFf(t )f(t)f(t)
9 fft  noise  snr 

1
周波数変調合成アルゴリズム
私が読んだ内容に基づいて、FMサウンド合成のアルゴリズムを作成しました。正しくできたかどうかはわかりません。ソフトウェアシンセ楽器を作成する場合、関数を使用して発振器を生成し、変調器を使用してこの発振器の周波数をモジュール化できます。FM合成が正弦波の変調にのみ機能すると想定されているかどうかはわかりませんか? アルゴリズムは、計測器の波動関数と、周波数変調器の変調器インデックスおよび比率を使用します。各ノートでは、周波数を受け取り、キャリアと変調器の発振器の位相値を保存します。変調器は常に正弦波を使用します。 これは疑似コードのアルゴリズムです: function ProduceSample(instrument, notes_playing) for each note in notes_playing if note.isPlaying() # Calculate signal if instrument.FMIndex != 0 # Apply FM FMFrequency = note.frequency*instrument.FMRatio; # FM frequency is factor of note frequency. note.FMPhase = note.FMPhase + FMFrequency / kGraphSampleRate # Phase of modulator. frequencyDeviation = sin(note.FMPhase * PI)*instrument.FMIndex*FMFrequency …

1
2つの空間信号の共分散行列に関する質問
私が共分散行列を理解したと思うたびに、誰かが別の定式化で登場します。 私は現在この論文を読んでいます: J.ベネスティ、「パッシブ音源定位のための適応固有値分解アルゴリズム」、J。アコースト。Soc。午前。107巻、第1号、384-391頁(2000) よくわからない製剤に出会いました。ここで、作成者は2つの信号バツ1バツ1x_1と間の共分散行列を作成していバツ2バツ2x_2ます。これらの2つの信号は、異なるセンサーからのものです。 1つの信号の共分散行列については、回帰行列を計算し、同じ行列のエルミート行列を掛けて、元のベクトルの長さであるNNNで割ることで得られることを知っています。ここでの共分散行列のサイズは任意であり、最大サイズはN× NN×NN\times Nです。 我々は、そのエルミートによって乗算次いで、最初の行の最初の信号、及びマトリクスの第2行の第2の信号を配置するとともに、除算場合に2つの空間の信号の共分散行列は、NNN、我々は得る2 × 22×22\times 2両方の空間信号の2共分散行列。 ただし、この論文では、著者は4つの行列R 1のように見えるものを計算します。、および R 2R11、R12、R21R11、R12、R21R_1{}_1, R_1{}_2, R_2{}_1、そしてそれらをスーパー行列に入れ、それを共分散行列と呼びます。R22R22R_2{}_2 これはなぜですか?これはテキストの画像です:

1
与えられた自己相関関数のフィルターを設計する際の単位問題
次の自動相関関数を持つWSSプロセスがあるとします。 r (τ) = σ2e- α | τ|r(τ)=σ2e−α|τ| r\left ( \tau \right ) = {\sigma}^{2} {e}^{-\alpha \left | \tau \right |} ラプラス変換は次のようになります。 R (s ) = L { r (τ) } = - 2 α σ2(S - α )(S + α )R(s)=L{r(τ)}=−2ασ2(s−α)(s+α) R \left ( s \right ) = \mathfrak{L} …

2
時間データのパターン認識
音声以外の音を検出して分類しようとしています。現在、私は探している機能として、トレーニングサウンドからの一連の移動するオーバーラップしたパワースペクトルを使用しています。 分析を行うときは、フィーチャの数が同じになるように、オーバーラップしたスペクトルの同じ量を計算しています。現在、パフォーマンスはあまり良くなく、無音か非無音かを検出することしかできません。 このタイプの信号検出にはどのような技術がありますか?私の懸念の1つは、時間領域で音の長さが異なると、特徴ベクトルの長さが異なるため、同じ分類子を使用できないため、こだわっていることです。
9 audio 

1
一連の基準間の相対距離を正確に測定(拡張現実アプリケーション)
5つのマーカーのセットがあるとします。ARToolkitなどの拡張現実フレームワークを使用して、各マーカー間の相対距離を見つけようとしています。私のカメラフィードでは、最初の20フレームに最初の2つのマーカーのみが表示されるため、2つのマーカー間の変換を計算できます。2番目の20フレームには、2番目と3番目のマーカーのみが表示されます。最後の20フレームは、5番目と1番目のマーカーを示しています。5つのマーカーすべてのマーカー位置の3Dマップを作成したいと思います。 私の質問は、ビデオフィードの品質が低いために距離が不正確になることを知っているのですが、収集したすべての情報から、不正確さを最小限に抑えるにはどうすればよいですか。 私の素朴なアプローチは、最初のマーカーを基点として使用することです。最初の20フレームから、変換の平均を取り、2番目のマーカーを配置し、3番目と4番目のマーカーを配置します。5番目のマーカーの場合、5番目と1番目の間の変換と4番目と5番目の間の変換の平均の中央に配置して、4番目と1番目の間に配置します。ただし、このアプローチでは、最初のマーカー配置に偏りがあり、フレームごとに3つ以上のマーカーが表示されるカメラは考慮されていません。 最終的には、システムでx個のマーカーのマップを計算できるようにしたいと考えています。任意のフレームで最大x個のマーカーが表示される可能性があり、画質に起因する非システムエラーがあります。 この問題への正しいアプローチに関する支援があれば大歓迎です。

1
画像のテクスチャ検出と領域プロパティ
解決しようとしている興味深い問題があります。たとえば、2つのテクスチャ(AとB)を含む白黒画像がある場合、個々のテクスチャを完全にカバーする境界のピクセル値を知りたいと思います。 画像上のテンプレート(凡例)の位置のクラスターを与える相互相関を使用することを考えましたが、それを使用して境界のピクセル値を取得する方法はありますか(これらは通常不規則です)?また、これを行う他のより良い方法はありますか? これの実際の例は、1年の3つのレベルの降雨を示すマップで降雨の領域を検出することです。各レベルには、凡例に存在するテクスチャが割り当てられ、同じ画像でのテクスチャマッチングに使用されます。

1
何である
フィルターのインパルス応答のフーリエ変換、ラプラス変換、Z変換とは何ですか?私が見てきた、システムの機能や転送機能、と呼ばれるものについてH (I ω )と離散化H (Z )?H(秒)H(s)H(s)H(私ω )H(iω)H(i\omega)H(z)H(z)H(z)
9 filters 

1
グレースケールであるはずのRGB画像のカラーチャネルシフトを見つける方法は?
水平方向に色をシフトしているように見えるレコーディングデバイスを使用しています。色の歪みが最小限の画像を取得するために、チャネルの2/3で行う必要があるシフト解除の量を知りたいのですが。 ここで、元の画像では少なくとも青のチャネルが約1.0ピクセルだけシフトして戻っていることがわかります。 問題は、最適なシフトなしの値をどのように検出できるかです。それらは整数ではないと確信しています。

2
表面検出
大きな領域の灰色(白から黒までの範囲)を画像からどのように分割しますか?(opencvでこれを知っている場合は、opencvで何をするかを言うことで答えることができます)。たとえば、次の図を考えてみます。 これはグレーの大きな領域であり、他の領域とは明確に区別できます。この領域にグレーの濃淡があり、リアルタイムで機能する必要がある場合、これをどのようにセグメント化できますか。 事前にTHX。

1
相互相関行列
私のグループでは、量子力学システムからの抽象的な情報を画像として表示するアルゴリズムを開発しました。このようにして、量子システムが与えられた場合、同じ情報を持ち、いくつかの特徴を可視化する関連画像を取得します。 重要な機能の1つは「相互相関行列」を使用して取得されます。画像をサブ画像に分割し、すべてのペア間の「オーバーラップ」を見つけます。したがって、サブイメージおよびのエントリ、は、それらがどの程度類似しているかを示す数値です。行列の次元はです。L×LL×LL\times LiiijjjAi,jAi,jA_{i,j}L2×L2L2×L2L^2\times L^2 問題は、次のとおりです。この行列または親族は、画像処理で使用されていますか?ある場合、名前はありますか?それには興味深い特性がありますか、それとも有用なアルゴリズムに役立ちますか?

2
ウェーブレットベースの相関測定は、追加の計算オーバーヘッドの価値がありますか?
信号間の相関の尺度として、相関とコヒーレンスの両方を使用しました。時間-周波数アプローチが私にこれらの世界のベストを与えると思っていました。 私の質問は、この余分なデータが信号の全体像に十分に追加され、計算の一部としてウェーブレット変換を行うことに関連する計算コストの増加を正当化できるかどうかです。 参照:ArXiv論文:S.Klimenko、G.Mitselmakher、A.Sazonovによる「確率的重力波の検出のためのウェーブレットドメインでの相互相関手法」

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.