信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

2
このローパスフィルターには非因果的なインパルス応答がありますか?
サウンドカードでいくつかの測定を行っています。1つの出力チャネルが1つの入力チャネルに接続されています。 次に、サウンドカードに単位インパルスを送信します。つまり、信号1の値の後にゼロが続きます。 記録された応答を以下に示します。 Rect関数またはLPFのフーリエ変換がSinc関数になることは知っています。これは、以下の応答のようです。しかし、応答の事前呼び出しの理由についてはよくわかりません。

2
スペクトル平坦度の標準偏差—では、概念的に何を測定しているのですか?
いびきを特定するための私の終わりのない探求で、「スペクトルの平坦性」が信号の「品質」の公正な尺度であるように見えることがわかりました。 FFTパワーデータポイントの相乗平均を同じポイントの算術平均で割ったものとして、スペクトル平坦度を計算しています。(R ∗ 2 + I∗ 2 )(R∗2+I∗2)(R*2 + I*2) 次に、(ここでは少しひねりを加えて)実行中の(50フレームを超える)算術平均とスペクトル平坦度の標準偏差を計算し、実行中の標準偏差を実行中の平均で割った「正規化」標準偏差を計算しています。 私のサンプルでは、音声が「良い」(つまり、眠っている被験者の呼吸音やいびき音を確実に追跡している)場合、この指標は約(最大程度)よりも大きく、通常は落ちるオーディオが「泥の中に」ある場合、未満。(他の要因と一緒に動くしきい値を使用することで、この差別をある程度改善できますが、それはおそらく別のトピックです。)また、バックグラウンドノイズが大きい場合(たとえば、誰かが部屋に入ってざわめくとき)は、測定値がを超えることもわかります。)。0.5 0.2 1.00.20.20.20.50.50.50.20.20.21.01.01.0 だから、私の基本的な質問は:私が測定しているものの名​​前(「スペクトル平坦度の正規化された標準偏差」を超えて)はありますか、そしてメトリックが「意味するもの」の概念的な説明を誰かが提供できますか? (私は信号の「品質」について他のダースのメトリックを試しましたが、これはこれまでで最も良いようです。) 追加: 私はおそらく、単純なスペクトル平坦性が測定しているもの(ウィキペディアの記事のみ)について特に優れた概念的なハンドルを持っていないことを認めるべきです。そのため、それ以上の説明はありがたいです。

5
MATLAB、離散信号をフィルタリングする方法は?
「fecg.mat」という名前のファイルに格納されたdoubleの1行10000列の行列があります。マトリックスは、記録されたFECG信号の大きさを表します。 時間に対してプロットしました(0から9999): ベースラインを削除するには、ハイパスフィルターを使用できるかどうか疑問に思います。適切なフィルターを設計するにはどうすればよいですか? PS信号処理は私の専門分野ではありません。離散時間領域信号をフィルタリングする方法がわかりません。
8 filters  matlab 

3
照明が変化するOpenCVの皮膚色不変
照明とは無関係に肌の色をとらなければなりません。次の基準を使用しましたが(hsvとrgbを使用)、機能しません。 int h = get_hue(...); int s = get_saturation(...); int r = get_red_component(...); int g = get_green_component(...); int b = get_blue_component(...); if ((h<38)&&(h>6)&&(s>0.23)&&(s<0.68)){ // skin color } else if ((r>95) && (g>40) && (b>20) && ((maximum(r,g,b)-minimum(r,g,b))>15) && (abs(r-g)>15)&&(r>g)&&(r>b)){ // also skin color } それは私の肌が照らされている朝には機能しますが、夕方までには機能しません。 どんな助けでもありがたいです。前もって感謝します。(PS-私の肌は白くありません。)

5
なぜ高周波をゼロにしたときにこのパチパチというノイズが出るのですか?
私は最近フーリエ変換を使って遊んでいます(数週間かけてその背後にある数学について学びました)。私は次のサウンドバイトにローパスフィルターを組み合わせてハックすることにしました: 特に、私はフーリエ変換を取り、周波数の最高の1/2をゼロにしてから、逆フーリエ変換を行いました。これは私が得たものです なぜパチパチという音がするのですか?

2
数値計算を超えた相互情報の意味は何ですか?
相互情報量を計算するための生の方程式以外に、物理的にはどういう意味ですか?例:情報理論から、エントロピーは、特定の確率分布を持つアルファベットで使用できる最小の損失のない圧縮スキームであることがわかります。 相互情報に関してはどういう意味ですか? 背景:ユニグラムの単語の相互情報量を計算して、2冊のうちどちらの本かを調べようとしています。 エッセンシャル私(b o o k ; w o r d)私(book;word) I(book; word)

3
ライン検出用のFFT
ほとんどの人が尋ねるのとは異なる方法でFFTを使用しようとしています。通常の繰り返しの垂直線があるグラフの写真を撮り、画像を処理して、線が平均してどれだけ離れているかをピクセルで判断できるようにしたいと考えています。私はキャニーエッジ検出とハフライン検出を試してみましたが、関心のあるラインのみを正確に検出できるほど画像を最適化できないと思います。 したがって、私の試みは、画像の10行をスキャンして、ピクセル値をピクセル列に対応するビンに蓄積することです。グラフ化すると、非常に見栄えの良い波形になります。これに対してDFTまたはFFTを実行すると、ライン反復の周波数であると思われるピークを見つけることができます。(これは誤った仮定である可能性があります) 私の質問は、この番号は何に対応していますか?つまり、ピクセル単位であるため、サンプリングレートがどうなるか混乱していると思います。これはFFTの有効な使用法だと思いますが、私が成功するはずだと思う時点でここに落ちています。 例として。幅300ピクセルの画像を作成しました。正確に30ピクセル間隔で描画された1ピクセル幅の線があります。2つのピークが見つかりました。1つは75に、もう1つは実際のコンポーネントの225(対称に見える)です。(架空のコンポーネントが再生されるとは思いませんか??)線が30ピクセル離れていることを知っています。75と225はどのように関連していますか? 私はこれを得るために一生懸命努力しています、そしてあなたが推薦することができるどんな助けにも感謝します。この時点で、エッジ検出をあきらめ、このアプローチを試してみたいと思います。 前もって感謝します。
8 image  opencv  fft  dft 

1
LFOを使用してオシレーターピッチを変調するアルゴリズムのヘルプ
アナログシンセサイザーのソフトウェアエミュレーションを開発しています。LFOを使用してオシレーターのピッチを変調しようとしています。コンピューターのサウンドシステムに供給される各サンプルについて、メインオシレーターに入力する周波数を次のように計算しています(擬似コード)。 osc_frequency = note_frequency * (1 + tuning) * (1 + lfo_y * lfo_mod_depth) このステートメントの変数は次のとおりです。 note_frequency =再生する音の周波数(Hz) チューニング=オシレーターの再生ピッチのパーセントでの微調整(例:-0.02 = 2%離調) lfo_y = lfo波形の現在のy値(範囲は-1から1) lfo_mod_depth =オシレーターに適用する効果の深さ/強度(パーセント) ただし、この計算では望ましい結果は得られません。中心周波数を中心にロックされたピッチが上下に変化するのが聞こえると思います(演奏中のノート)。私が得ているのは、ピッチを「逃がす」モジュレーションエフェクトです。何が起こっているのか正確にはわかりませんが、次のように聞こえます。 変調強度は時間とともに増加します(変調が到達する高/低周波数マークは、ノートが長く保持されるほど高く/低くなります) 変調強度は時間とともに一定のままですが、中心周波数は増加しますが、変調はその周囲で振動します 私は正しいアプローチを使用していますか?そうでない場合、正しいアプローチはどうあるべきですか?これでどんな助けでも大歓迎です。


2
ノイズのある複数の信号のSNRを定義する方法は?
Iは、所与の加法性雑音によって汚染測定の信号の存在の数を推定する必要がのベクトルスナップショット次元Xとしてモデル化され、X = A S + ZここでsはあるK × 1つの表すベクトルkの異なる信号を。Aはn × kの非ランダム行列、zはn × 1のノイズベクトルです。(このモデルは配列処理の問題で一般的です。)nnnxx\bf xバツ=As+zx=As+z \bf x = \bf A \bf s + \bf z ss\bf sk ×1k×1k \times 1kkkああ\bf An × kn×kn \times kzz\bf zn × 1n×1n \times 1 SNRをどのように定義する必要がありますか(信号ごと、平均など)。


4
システム識別のためのドライブ信号の選択?
(私はシステムの識別について少し学習しているだけなので、この質問の言葉遣いが悪ければ事前に謝罪します) システム識別用の駆動信号をどのように選択しますか?PRBS信号が使用されているのを見てきましたが、チップレート付近の周波数ではうまく機能するようですが、実際には低周波数ではありません。周波数スイープも見ました。 特定の範囲の極を持つ2次の線形システムに近いことがわかっているSISOシステムがあり、振幅Aまでの任意の信号で、ある時間長Tまでそれを駆動できる場合、どのように選択しますか伝達関数の精度を決定するための最良の応答を私に与える信号? 「システム識別ドライブ信号」をグーグル検索してみましたが、質問に関連するものは何も表示されません。 編集:私が扱ってきた特定のタイプのSISOシステムは、パワー半導体の熱挙動の(入力=電力損失、出力=温度)システムであり、通常、非常に低い周波数に支配的な極があるため、モデル化するのは非常に難しいようです( <1Hz)と次のものは100倍高くなる可能性があるため、高周波ドライブ信号は非常に大きく減衰します。

3
事前分布が不明な観測から最適なバイナリ決定ルールのしきい値を決定する
事前の情報が不明なガウスノイズによって摂動されたバイナリ信号の観測のみが与えられた場合、どのようにして最適な判定しきい値を推定できますか? (いいえ、これは宿題ではありません) 具体的には、次のモデルについて考えていますは2つの状態ランダム変数です。(H 0、H 1)YYY(H0、 H1)(H0、H1)(H_0,H_1) P(Y| H0)〜N(μ0、σ)P(Y|H0)〜N(μ0、σ)P(Y|H_0) \sim \mathcal N(\mu_0,\sigma) P(Y| H1)〜N(μ1、σ)、μ0&lt; μ1P(Y|H1)〜N(μ1、σ)、μ0&lt;μ1P(Y|H_1) \sim \mathcal N(\mu_1,\sigma),\quad \mu_0 < \mu_1 P(H0)= π0P(H0)=π0P(H_0) = \pi_0 P(H1)= 1 - π0P(H1)=1−π0P(H_1) = 1-\pi_0 未知のパラメータ:。μ0、μ1、σ、π0μ0、μ1、σ、π0\mu_0, \mu_1, \sigma, \pi_0 最大事後確率対数しきい値は、私が知っている場合、これらのパラメーターから計算できます。私は当初、しきい値に到達するために最初にパラメーターを推定する方法を考えてい。しかし、私はを直接推定する方がより堅牢かもしれないと思っています。YtYtY_tYtYtY_t 思考:正規化の観察(サンプル平均値を減算し、標準偏差で割る)2次元にパラメータ空間を減少させる:π0π0\pi_0とσμ1− μ0σμ1−μ0\frac \sigma{\mu_1-\mu_0}。

1
画像から反射を取り除く方法は?
私は画像をより良いものにし、不要な妨害をすべて取り除いて遊んでいます。主な懸念は、来るかもしれない不要な反射を取り除くことだとわかりました。 私は、これらの反射を取り除くためにICAを使用する論文を読みました。他にどのような方法が機能しますか? 画像があるとしましょう: 別の画像: CMYKに変換しました このセミブラック部分を削除するにはどうすればよいですか?

1
離散信号エネルギー計算に関する質問
私は信号エネルギーの定義を見ています(例:Wikipedia、cnx.org)。離散信号の場合、次のように定義されます。ここで、は信号を保持します。x (n )x(n)x(n) EN E R Gy= ∑∞N = - ∞| x(n) |2Energy=∑n=−∞∞|x(n)|2 Energy = \sum_{n=-\infty}^{\infty} |x(n)|^2 だから私の質問: のようなウィンドウ化された有限信号の場合double signal[256]、合計はからではなく、1から256(またはプログラムでは0から255)です。(私は無限を合計する方法すら知りません。)∞- ∞−∞-\infty∞∞\infty エネルギー式に絶対値演算子があるのはなぜですか ?絶対値をとった結果はとにかく二乗されて正の値を生成するため、絶対値をとっても意味がないようです。これは、が複素数になる可能性があるため、複素数の絶対値はピタゴラスの定理からのスカラーになりますか?x (n )| 。。。||...||...|x (n )x(n)x(n)

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.