信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

1
二次多項式フィルターの設計に分析的なアプローチはありますか?
以下の論文は、ティーガー・カイザーのエネルギー演算子のX線画像強調への応用について説明しています: ラインハルト・バーンスタイン、マイケル・S・ムーア、サンジット・K・ミトラ、「画像強調のための調整可能な二次フィルター」 Proc。IEEE Image Conference on Image Processing(ICIP)、Santa Barbara、CA、vol。1、pp。287-290、1997年10月。http://vision.ece.ucsb.edu/publications/view_abstract.cgi?52 著者は、同様の線形演算子との類推を通じてフィルターの動作の直観を開発します(つまり、「したがって、ティーガーフィルターの出力は、ローカル平均で重み付けされたハイパスフィルター応答にほぼ等しい」)。精度のために、二次多項式フィルターとは、以下のように、切り捨てられたVolterra Seriesによって完全に特徴付けられる非線形、非再帰的なフィルターを意味します(1Dの場合): y(n)=∑m1=0N1−1h1(m1)x(n−m1)+∑m1=0N2−1.∑m2=0N2−1h2(m1,m2)x(n−m1)x(n−m2)y(n)=∑m1=0N1−1h1(m1)x(n−m1)+∑m1=0N2−1.∑m2=0N2−1h2(m1,m2)x(n−m1)x(n−m2) y(n) = \sum_{m_1=0}^{N_1-1}{ h_1(m_1)x(n - m_1) } + \sum_{m_1=0}^{N_2-1}{\hphantom{.}\sum_{m_2=0}^{N_2-1}{ h_2(m_1,m_2)x(n - m_1)x(n - m_2) } } 低次の多項式フィルターの設計へのほとんどのアプローチには、システム同定フレームワークが含まれますが、推定されたフィルターが機能する理由についての深い理解はありません。現在、線形アナロジーに基づく分析的アプローチは最新技術ですか、または使用できる既知の数学ツールはありますか?
19 filters 

1
画像の相関と畳み込みの違いは?
画像のフィルターによって行われる相関と畳み込みの違いは何ですか? 信号処理の定義の意味では、畳み込みはLTIシステムの出力を表すことを知っています。つまり、LTIシステムが入力システムとの畳み込みにより出力を生成する場合、出力信号は畳み込みの結果として記述することができます入力信号とLTIシステムのインパルス応答。相関に関しては、信号間の類似性を記述します。しかし、畳み込みと相関は画像にどのように影響し、効果の点でどのように違いますか? ありがとう

1
ラプラス変換は冗長ですか?
ラプラス変換フーリエ変換ので、フーリエ変換の一般化であるラプラスのための変換である(すなわち、Sは純虚数=ゼロ実部S)。S = jはωs=jωs = j\omegassssss 通知: フーリエ変換:バツ(ω )= ∫x (t )e- J ω トンdtX(ω)=∫x(t)e−jωtdtX(\omega) = \int x(t) e^{-j\omega t} dt ラプラス変換:バツ(s )= ∫x (t )e− s tdtX(s)=∫x(t)e−stdtX(s) = \int x(t) e^{-s t} dt また、信号は、そのフーリエ変換とラプラス変換から正確に再構築できます。 再構成に必要なのはラプラス変換の一部(の部分)のみであるため、残りのラプラス変換(ℜ (s )≠ 0)は再構成には役に立たないようです...R(s)=0ℜ(s)=0\Re(s) = 0R(s)≠0ℜ(s)≠0\Re(s) \neq 0 本当ですか? また、ラプラス変換の別の部分で信号を再構成できますか(例:またはℑ (s )= 9)?R(s)=5ℜ(s)=5\Re(s)=5I(s)=9ℑ(s)=9\Im(s)=9 そして、信号のラプラス変換を計算し、ラプラス変換の1点のみを変更し、逆変換を計算するとどうなりますか。元の信号に戻りますか?

2
移動平均フィルターのカットオフ周波数は何ですか?
カットオフ周波数が7.8 Hzの移動平均フィルターを設計する必要があります。以前に移動平均フィルターを使用しましたが、私が知る限り、入力できるパラメーターは平均化するポイントの数だけです...これはカットオフ周波数とどのように関連しますか? 7.8 Hzの逆数は〜130 msであり、1000 Hzでサンプリングされたデータを使用しています。これは、130個のサンプルの移動平均フィルターウィンドウサイズを使用する必要があることを意味しますか、それとも私がここで見逃しているものがありますか?

3
自分の声を他の人に見せます
Sooo ..私はこのようなことを考えてきました。私たちは皆、私たちが自分の声で聞いているものとは異なる音であることを知っています。自分を録音して聞くことで、他の人が私たちをどのように聞いているかを簡単に見つけることができます。 しかし、他の方法はどうですか? 自分の声を知覚するときに他の人が私たちの声を聞くことができるように、私たちの声を変える方法はありますか?とても興味深い質問だと思います。悲しいことに、Googleで数回検索した後、ウェブ上で何も見つかりませんでした。誰もこれについて考えたことがありませんか、または私が見ていない何らかの理由で不可能ですか? これに関する任意のリードをいただければ幸いです:)。

4
音声アクティビティ検出用のライブラリ(音声認識ではない)
前回の質問のフォローアップとして、音声検出ライブラリが存在するかどうか疑問に思っていました。音声検出とは、音声バッファを渡し、音声の開始と停止のインデックスを取得することを意味します。したがって、44kHzで10秒間のオーディオサンプリングがある場合、次のような数値の配列が期待されます。 44000 88000 123000 190334 ... これは、たとえば、スピーチが1秒で始まり、2秒で終わることなどを示します。 私が探していないのは、話し言葉からテキストを書き出す音声認識です。残念ながら、これは「音声検出」をグーグルで検索したときによく見られるものです。 ライブラリがC、C ++、またはObjective-Cで作成されていれば、iPhone用のアプリを作成しているので素晴らしいことです。 ありがとう!
18 audio  speech 

4
Canny Edge Detectorの制限は何ですか?
エッジ検出アルゴリズムおよびエッジ検出を使用するアプリケーションに関する文献の大部分は、キャニーのエッジ検出器を参照しています。エッジ検出のほぼ「解決策」のように見えるほどです。確かに、ノイズのバランスを取り、エッジを保存するのに最適です。 しかし、単純な好奇心として、Cannyのエッジ検出器に関心のある領域はありますか?または、Cannyが最適ではないアプリケーションの領域はありますか? これに関連して、実装の高速化はそれほど重要ではありません。エッジ検出器の良し悪しは、生成されるエッジの品質と有用性に焦点を当てる必要があります。 また、私は実際に実装固有の問題に焦点を合わせていません。アルゴリズムに固有のより理論的な制限または特性を探しています。

2
周波数領域ゼロパディング-X [N / 2]の特別な処理
周波数領域でゼロパディングすることにより、偶数個のサンプル(たとえばN = 8)で周期信号を補間したいとします。 DFTにしましょうそれでは、X=[A,B,C,D,E,F,G,H] 16個のサンプルにパッドしてみましょうY。私が見たすべての教科書の例とオンラインのチュートリアルでは、与えるときにゼロを挿入します。 (次に、補間された信号です。)[Y4...Y11] Y=[2A,2B,2C,2D,0,0,0,0,0,0,0,0,2E,2F,2G,2H]y = idft(Y) 代わりに使用しないのはなぜ Y=[2A,2B,2C,2D,E,0,0,0,0,0,0,0,E,2F,2G,2H]ですか? 私が知る限り(私の数学の知識は限られています): 総電力を最小化します xが実数値である場合、そうであることが保証されますy yまだ交差するx全てのサンプル点では、必要に応じて(私は、これはすべてのために本当だと思うpところY=[2A,2B,2C,2D,pE,0,0,0,0,0,0,0,(2-p)E,2F,2G,2H]) では、なぜこのように行われないのでしょうか? 編集:x必ずしも実数値または帯域制限ではありません。

5
カメラからの2つの写真を比較して、動きを検出するのに十分な違いがあるかどうかを確認するにはどうすればよいですか?
電話をCCTVシステムとして使用して、家の部屋を制御し、何かが動いているときにアラートを表示したい。 今のところ、私が成功したのは、毎分画像を取​​得し、PHPスクリプト経由でサーバーにアップロードすることです。ここで、現在の写真と1分前の写真を比較して、誰かが部屋に入ったかどうかを検出したいと思います。したがって、基本的には、写真のピクセルの違いを比較する必要があります(ただし、雲が1分間に挨拶し、明るさを変えただけであることも考慮に入れます) 誰がそれを達成するか、または読むためのドキュメントの手がかりを持っていますか?

5
区分的線形データを近似
区分的に線形だがノイズの多いデータに適合する堅牢な方法は何ですか? いくつかのほぼ線形のセグメントで構成される信号を測定しています。遷移を検出するために、データに複数の行を原子的に適合させたいと思います。 データセットは1〜10個のセグメントを持つ数千のポイントで構成されており、セグメントの数はわかっています。 これは自動的にやりたいことの例です。
18 algorithms 

3
線形フィルターと非線形フィルターの違いは何ですか?
平均フィルターは線形フィルターと呼ばれ、中央値フィルターは非線形フィルターと呼ばれますか?平均および中央値フィルターの動作方法は理解していますが、線形および非線形という用語とは関係がありませんでした。例を挙げて説明してください。

3
ガウスぼかし-標準偏差、半径、カーネルサイズ
GLSLにガウスぼかしフラグメントシェーダーを実装しました。私はそのすべての背後にある主要な概念を理解しています:畳み込み、線形性を使用したxとyの分離、半径を増やすための複数のパス... まだいくつか質問があります: シグマと半径の関係は何ですか? シグマは半径に相当することを読みましたが、シグマがピクセルでどのように表現されるかわかりません。または、「半径」は単なるピクセルの名前ではなく、シグマの名前ですか? シグマを選択するにはどうすればよいですか? シグマを増やすために複数のパスを使用することを考慮して、所定のパスで必要なシグマを取得するために適切なシグマを選択するにはどうすればよいですか?結果のシグマがシグマの平方和の平方根に等しく、シグマが半径に等しい場合、希望する半径を取得する簡単な方法は何ですか? カーネルの適切なサイズはどのくらいですか?また、シグマとどのように関連していますか? ほとんどの実装が5x5カーネルを使用するのを見てきました。これはおそらく、適切な品質の高速実装に適した選択肢ですが、別のカーネルサイズを選択する別の理由はありますか?シグマはカーネルサイズとどのように関連していますか?私のカーネルの外の係数が無視でき、正規化されるように、最良のシグマを見つける必要がありますか?

2
FFTでスペクトルリークが発生するのはなぜですか?
グーグルやウィキペディアで試してみましたが、「入力信号の周波数が2つのビンの間にあるため」という以外の答えは得ていません。 これが理由であると理解していますが、理解できないのは、漏れが隣接する1つのビンだけではなく、いくつかの隣接するビンにまで及ぶように見える理由です。 私が話していることを説明するために、シミュレートされたデータをいくつか示します(投稿の最後のコード): 上記は、周波数10の正弦波のFFTスペクトル(対数スケールでプロット)です。サンプリングレートは1、サンプル数は100です。グラフはFFTシフトされています。ビン10には明らかにピークのみがあり、残りは数値誤差のオーダー、またはその付近にあります。 これは、10.1の生成された周波数での周波数スペクトルです。明らかに、すぐ隣のビンよりも多くのビンへの「漏れ」があります。 これは、周波数10.5のプロットです。 質問:この漏れがあるのはなぜですか。また、すぐ隣のビンではなく、他のすべてのビンに広がっているのはなぜですか? 興味のある人のためのコード(Pythonコード) import numpy as np import matplotlib.pyplot as plt xFreq = 10.5 xSize = 100.0 xPeriod = xSize/xFreq x = np.linspace(1,xSize,xSize) data = np.sin(2*np.pi*x/xPeriod) fft = np.fft.fft(data) fft = np.fft.fftshift(fft) fig = plt.figure() ax = fig.add_subplot(111) ax.plot(abs(fft), "o") ax.set_yscale('log') plt.show() 私は変更xFreqの価値を10.0する10.5など、

2
画像のサイズ変更は、固有のカメラマトリックスにどのように影響しますか?
サイズがHxWの画像で知られているカメラマトリックス(固有パラメーターと外部パラメーターの両方を知っています)があります。(必要な計算にこのマトリックスを使用します)。 もっと小さな画像を使いたい、例えば:(元の半分)。同じ関係を維持するために、マトリックスにどのような変更を加える必要がありますか?H2×W2H2×W2\frac{H}{2}\times \frac{W}{2} 私は、持っている固有パラメータ、(AS、回転と並進)KKKRRRTTT cam=K⋅[RT]cam=K⋅[RT]\text{cam} = K \cdot [R T] K=⎛⎝⎜ax000ay0u0v01⎞⎠⎟K=(ax0u00ayv0001)K = \left( \begin{array}&a_x &0 &u_0\\0 &a_y &v_0 \\ 0 &0 &1\end{array} \right) KKKは3 * 3です、、、およびに0.5(画像のサイズが変更された係数)を掛けることを考えましたが、ません。axaxa_xayaya_yu0u0u_0v0v0v_0

3
信号フィルターを設計するための優れた教科書
数ヶ月前から、動的システムの制御の分野に積極的に関与し始めました。 ほとんどの場合、特定の動的システム用にコントローラーを設計するには、特に信号フィルターの分野でデジタル信号処理技術を使用する必要があります。 私は制御工学のバックグラウンドを持っていないので、シグナルフィルターを扱っているサウンド教科書の提案を詳細に提供してもらえないかと思います。 教科書は理想的には以下を含むべきです: DSPの分野で最も一般的なフィルターの紹介。 周波数領域と時間領域の両方での主な特性の説明。 どのシナリオで一般的に使用されますか(フィルターの役割または機能)。 素朴な質問ではありますが、いくつかの教科書をアドバイスしてください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.