信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

1
ホワイトノイズの位相および振幅応答とは何ですか?
周波数領域でホワイトノイズを作成し、Pythonを使用して時間領域に変換します。問題を理解するために、時間領域でホワイトノイズを生成し、それを周波数領域に変換しました。 import scipy.signal as sg import numpy as np import matplotlib.pyplot as plt e = np.random.normal(0,1,1e3) E = sg.fft(e) plt.figure("Bode plot") plt.subplot(211) plt.title("Magitude") plt.plot(abs(E)) plt.subplot(212) plt.title("Phase") plt.plot(np.angle(E)) plt.show() 私は期待したようにまったく見ていない: 質問: ホワイトノイズの振幅応答はフラットになるはずではありませんか?(すべての周波数で等しい量) 標準偏差(私の例では1)と振幅と位相の関係は何ですか? 前もって感謝します!
16 fft  noise  python 


8
DSPまたは信号/画像/データ処理のジョーク
他のStackExchange / StackOverflowサイトには、一定レベルのユーモアや楽しみがあります。 お気に入りの「データ分析」漫画は何ですか?因果関係と相関関係に関するこのxkcd漫画(IMHO)に特に言及する価値があります(DSPの人々は私が言っていることを知っています)。 だから、ユーモアが答えでは許可されていますか?私はそう願っています、例えばse: StackOverflow:あなたの最高のプログラマーの冗談は何ですか? MathOverflow:良い数学ジョークが存在するか SE.Stats(検証済みクロス):統計ジョーク SE.Stats(Cross Validated):お気に入りの「データ分析」漫画は何ですか? SE.Maths 数学のジョークに関する質問 信号処理または画像処理のユーモアは存在しますが、浅く狭い範囲にあります。トルコのイスタンブールで開催されたICASSP 2000 DSPユーモア展で、私は最初に(以前はユーモアがなかった)それに遭遇しました。以下の画像は、EURASIPのDSPのユーモアからのものです。 だから私たちはいくつか値すると信じているhumorとjoke、タグと実際の明るさを。どうぞ!

7
FFTを高速化するDFTとFFTの違いは何ですか?
私はFFTを理解しようとしていますが、ここに私が持っているものがあります: 波形内の周波数の大きさを見つけるには、2つの異なる位相(sinとcos)で、波形に検索対象の周波数を掛け、それぞれを平均化することにより、周波数を調べる必要があります。フェーズは2つとの関係によって検出され、そのためのコードは次のようなものです。 //simple pseudocode var wave = [...]; //an array of floats representing amplitude of wave var numSamples = wave.length; var spectrum = [1,2,3,4,5,6...] //all frequencies being tested for. function getMagnitudesOfSpectrum() { var magnitudesOut = []; var phasesOut = []; for(freq in spectrum) { var magnitudeSin = 0; var magnitudeCos …
16 fft  dft  algorithms 


3
極と周波数応答の関係
私は最近、周波数1で無限の応答があるため、極s = 1を考慮して誤解に陥りました。しかし、応答は1のみでした。 第二に、理論は、極が左のs平面にあるとき、システムは安定しているため、時間の経過とともに減衰すると言います。ちょっと待って。「極」とは、無限の応答、つまり時間の経過を意味しますか? 最後に、DSPでの正しい質問ですか?IMO、Dはデジタルを表し、sドメインはアナログです。投稿にラベルを付けるためのs-planeまたはLaplace変換タグが見つかりません。 更新答えてくれてありがとう。私はそれを持っているようですが、1つのマイナーだが基本的なこと-周波数との極(およびゼロ)の関係。基本的に、なぜ固有値(または、sss演算子/変数をどのように呼び出すか)が周波数に関連するのはなぜですか?それはどういうわけか指数関数的成長とラプラス変換と関係があるはずです。極がたまたま固有値であることをよく理解しています(特に離散的な繰り返しの場合)。しかし、これは周波数とどのように関係していますか?

5
スケールおよび回転不変フィーチャ記述子
フィーチャ検出で使用するために、いくつかのスケールおよび回転不変フィーチャ記述子をリストできますか。 このアプリケーションは、マルチクラス分類器を使用して、UAVによってキャプチャされたビデオ内の車と人間を検出するためのものです。 これまでのところ、SIFTとMSER(アフィン不変)を見てきました。私もLESHを見ました、LESHはローカルエネルギーモデルに基づいていますが、回転不変ではない方法で計算され、ローカルエネルギーを利用して回転不変を構築する方法を考えようとしています機能記述子、私はここを読みます商用アプリケーションで使用できるSIFT / SURFの無料の代替手段は何ですか?、「関心点に方向を割り当て、それに応じて画像パッチを回転させると、回転不変性が無料で得られます」が、これがさらに当てはまるかどうか、またはこれを私の問題にどのように適用できるかわかりません感謝します、ありがとう

4
上からの人の検出
私は、地上3メートルのカメラを1つだけ使用して、人を検出する方法を見つけようとしています。これはカメラによって返されるフレームです: 更新:ビデオテスト-> http://dl.dropbox.com/u/5576334/top_head_shadow.avi そのためには、まず、バックグラウンドとフォアグラウンドのセグメンテーションを実行する必要があることを理解します。それは簡単な部分です。 前景マスクを使用すると、ハフ変換などの簡単な操作で円を見つけることができますが、この方法では、多くの誤検出を含む頭部の60%しか検出されません。 色分けのような他の簡単なテクニックを使用することもできますが、髪型、色、髪の量などのために、人々の頭は上とは大きく異なることがわかりました... 私がそれについて持っている他のオプションは、HOG記述子、またはHaarのような機能を使用する可能性ですが、モデルを訓練するには上から見た人々の広範なデータベースが必要です。私はそのようなものを見つけていません。 これは非常に頻繁に起こる問題だと思っていましたが、文学やインターネットではあまり見つけることができません。このタスクを解決するための助けをいただければ幸いです:-) 更新:詳細については、目標は歩行者の流れを追跡するための一般的な方法を実装することです。最初のプロトタイプはモールでテストされます。

1
用語:スペクトル、スペクトログラム、スペクトログラフ、ソノグラムなど
DSPグラフィックスまたはインストルメンテーション出力の適切な命名規則または受け入れられている命名規則に関して、スペクトル、スペクトログラム、スペクトログラフ、および同様の用語の違いは何ですか?また、チャート、グラフ、CRTディスプレイなどの種類はそれぞれ最もよく説明しています。 追加:また、スペクトル対時間グラフィックスの数冊の本で使用されるソノグラムという用語を見つけました。したがって、上記の用語のいずれかを優先して適切な場合、またはその逆の場合はいつですか?

4
正弦波の多項式近似を見つける
Iは、で与えられる正弦波近似するsin(πx)sin⁡(πx)\sin\left(\pi x\right)単純に多項式波形整形を適用することにより、三角波関数によって生成されるが、 T(x)=1−4∣∣12−mod(12x+14, 1)∣∣T(x)=1−4|12−mod⁡(12x+14, 1)|T\left(x\right)=1-4\left|\tfrac{1}{2}-\operatorname{mod}(\tfrac{1}{2}x+\tfrac{1}{4},\ 1)\right| ここで、mod(x,1)mod⁡(x,1)\operatorname{mod}(x, 1)の小数部分であり、xxx: mod(x,y)≜y⋅(⌊xy⌋−xy)mod⁡(x,y)≜y⋅(⌊xy⌋−xy) \operatorname{mod}(x, y) \triangleq y \cdot \left( \left\lfloor \frac{x}{y}\right\rfloor - \frac{x}{y} \right) テイラーシリーズは波形整形として使用することができます。 S1(x)=πx2−πx233!+πx255!−πx277!S1(x)=πx2−πx233!+πx255!−πx277!S_1\left(x\right)=\frac{\pi x}{2}-\frac{\frac{\pi x}{2}^3}{3!}+\frac{\frac{\pi x}{2}^5}{5!}-\frac{\frac{\pi x}{2}^7}{7!} 上記の関数を考えると、S1(T(x))S1(T(x))S_1(T(x))は正弦波の適切な近似を取得します。しかし、合理的な結果を得るには、シリーズの7乗に上げる必要があります。ピークは少し低く、傾斜が正確にゼロにはなりません。 テイラー級数の代わりに、いくつかのルールに従って多項式ウェーブシェイパーを使用できます。 -1、-1、+ 1、+ 1を通過する必要があります。 -1、-1、+ 1、+ 1の勾配はゼロでなければなりません。 対称でなければなりません。 要件を満たす単純な関数: S2(x)=3x2−x32S2(x)=3x2−x32S_2\left(x\right)=\frac{3x}{2}-\frac{x^3}{2} グラフS2(T(x))S2(T(x))S_2(T(x))とsin(πx)sin⁡(πx)\sin\left(\pi x\right)かなり接近しているではなく、近くテイラー級数として。ピークとゼロクロッシングの間に、それらは目に見えて少しずれています。要件を満たす、より重く、より正確な機能: S3(x)=x(x2−5)216S3(x)=x(x2−5)216S_3\left(x\right)=\frac{x(x^2-5)^2}{16} これはおそらく私の目的には十分ですが、正弦波により近く、計算的に安価な別の関数が存在するかどうか疑問に思っています。上記の3つの要件を満たす関数を見つける方法についてはかなりよく理解していますが、それらの要件を満たし、正弦波に最も近い関数を見つける方法はわかりません。 正弦波を模倣する多項式を見つけるための方法はありますか(三角波に適用される場合)? 明確にするために、奇数対称の多項式だけを探しているわけではありませんが、それらは最も簡単な選択です。 次の関数のようなものも私のニーズに合う可能性があります。 S4(x)=3x2+x24+x44S4(x)=3x2+x24+x44S_4\left(x\right)=\frac{3x}{2}+\frac{x^2}{4}+\frac{x^4}{4} これは負の範囲の要件を満たし、区分的なソリューションを使用して正の範囲にも適用できます。例えば 3x2−P(x,2)4−P(x,4)43x2−P(x,2)4−P(x,4)4\frac{3x}{2}-\frac{P\left(x,2\right)}{4}-\frac{P\left(x,4\right)}{4} ここで、PPPは符号付きべき関数ですです。 また、小数指数をサポートするために符号付きべき関数を使用するソリューションにも興味があります。これにより、別の係数を追加せずに別の「ツイストノブ」が得られます。 a0x …

2
グリッドのような構造を検出するためのハフ変換の代替
私はグリッド形状を形成する複数の「角度」で構成される画像を持っています: いくつかの検索の後、ハフは行の区切りに悩まされていないため、ぴったりのように見えました。ただし、私が抱えている問題は、線が「太っている」ことであり、実行するエッジ検出(この場合はCanny)は、中央ではなく線のエッジを選択します。 これは、ハフ変換が、中央ではなくグリッド線の「側面」の一方(または両方)を選択することを意味します。 私が探しているもの(このグリッドのような形状、常にほぼ同じ方向)を知っているので、「エッジ検出」部分を実行して中心線を与えるより良い方法がありますか、または探しているべきですか?全く異なる方法で?

5
Pythonでサンプリングされた信号のローパスフィルタを書く方法は?
1 ns(1e-9秒)ごとにサンプリングした信号があり、たとえば1e4ポイントがあります。この信号から高周波をフィルタリングする必要があります。10 MHzより高い周波数をフィルタリングする必要があるとしましょう。カットオフ周波数より低い周波数では、信号は変更されずに渡されます。これは、カットオフ周波数より低い周波数ではフィルターのゲインが1になることを意味します。フィルター次数を指定できるようにしたいと思います。つまり、カットオフ周波数後の1次フィルターには20 db / decadeの勾配(電源ロールオフ)があり、カットオフ周波数後の2次フィルターには40 db / decの勾配があります。コードの高性能が重要です。

4
圧縮センシングの適用性
私が聞いたことから、圧縮センシングはスパース信号に対してのみ利用できます。これは正しいです? その場合、スパース信号と帯域制限信号をどのように区別できますか?すべての信号は、その場合にスパース信号になるよりもスパースまたはゼロ係数の信号部分を含むように拡張できますか? また、圧縮センシングは常に情報または信号を完全に取得しますか? 追加:ところで、私はこれらのことを学び始めたばかりなので、この質問の目的はこれらのことを少し味見することです。

1
SVD / PCA計算からの新しい画像のフィッティング
ウィキペディアのEigenfaceページからアイデアを複製しようとしています。数百サンプル画像データで表される行列(各画像は、長さのベクトルに平坦ここで、従ってであるによって行列)、IはSVD分解を計算しました。XX\bf XnnnXX\bf X100100100nnn X=UΣVTX=UΣVT\begin{equation} \bf X = U \Sigma V^{T} \end{equation} したがって: XXT=UΣ2UTXXT=UΣ2UT\begin{equation} \bf X X^{T} = U \Sigma^2 U^{T} \end{equation} 最大の固有モードのサブセットを取得することにより、行列を近似できます()。qqqσ1≥σ2≥⋯σ1≥σ2≥⋯\sigma_1 \ge \sigma_2 \ge \cdots X≈σ1u1vT1+σ2u2vT2+⋯+σquqvTqX≈σ1u1v1T+σ2u2v2T+⋯+σquqvqT\begin{equation} {\bf X} \approx \sigma_1 u_1 v_1^{T} + \sigma_2 u_2 v_2^{T} + \cdots + \sigma_q u_q v_q^{T} \end{equation} ない画像を表す新しいベクトル与えられた場合、新しい画像を最もよく表すために固有ベクトル重み付けを決定するにはどうすればよいですか?病的な場合を除いて、この表現はユニークですか?yyyXX\bf XqqqUU\bf Uyyy 要するに、私がやりたいことはこれです(wikiページから): これら固有顔は、現在既存および表現するために使用することができる新たな顔を:我々ができ突出固有顔に新しい(平均減算)画像をすることにより、記録方法、平均面からの新しい顔が異なります。 その投影法をどのように行うのですか?

1
制御システムのプレフィルターでマイナス(不安定)に対処する方法は?
したがって、一次時間遅延システム用のPIコントローラーの設計方法に答えながら (質問はこちら) 制御システムに対する閉ループ方程式は次のとおりです。 GC(s )= KT(1 − s T)(s )s3+ (1T+ a − KKp)s2+ (aT+ KKPT+ K私)s + KK私TGC(s)=KT(1−sT)(s)s3+(1T+a−KKp)s2+(aT+KKPT+K私)s+KK私T G_C(s) = \frac{\frac{K}{T}(1-sT)(s)} { s^3 + (\frac{1}{T} + a - KK_p)s^2 + (\frac{a}{T} + \frac{KK_P}{T} +K_I)s+\frac{KK_I}{T}} 質問:フィルターが不安定な場合、閉ループ伝達関数で分子を正規化するにはどうすればよいですか?(飛行機のRH上のポール) 通常、コントローラーの前に以下を行うフィルターを導入します。 1KT(1 − s T)(s )1KT(1−sT)(s) \frac{1} {\frac{K}{T} (1-sT)(s)} 分子を正規化する ただし、次の用語により、フィルター自体は不安定です。 は、システムをまったく実現できないという問題を引き起こすステップ応答に対して不安定です。1(1 − s …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.