信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

3
クラスを線形分離可能な高次元の特徴空間にデータを変換すると、なぜ過剰適合につながるのでしょうか。
私の本(WebbとWileyによる統計的パターン分類)で、SVMと線形的に分離できないデータに関するセクションを読みました。 多くの実際の実用的な問題では、クラスを分離する線形境界はなく、最適な分離超平面を検索する問題は意味がありません。高度な特徴ベクトルを使用して、クラスが線形分離可能な高次元の特徴空間にデータを変換したとしても、これはデータの過剰適合につながり、一般化能力が低下します。Φ(x)Φ(x)\Phi(x) データをクラスが線形分離可能な高次元の特徴空間に変換すると、過剰適合と一般化能力の低下につながるのはなぜですか?


1
IおよびQコンポーネント、およびQPSKと4QAMの違い
4QAMとQPSKはどちらも明らかに同じ波形を生成しますが、それらは数学的に同じですか? QPSKコンスタレーションで、4QAMが0、90、180、270にあるときにマッピングポイントは45、135、225、315度にありますか? また、そのようなコンスタレーションダイアグラムのI / Qコンポーネントを理解するのに苦労しています。「同相」と「直角位相」は実際にはどういう意味ですか?これらは、このタイプの使用法の実数部と虚数部を指定する別の方法ですか?



1
超音波スピーカーの校正と校正済み信号の発信
予測可能な信号を発することを目的として超音波スピーカーを調整しようとしていますが、悲しいかな、おそらくDSP-fuが不足しているためです。 少し背景 私が持っている校正済みのレコーディングにできるだけ近いサウンドを再生できるようにしたいです。理論を理解している限り、スピーカーの伝達関数を見つけて、放出したい信号をデコンボリューションする必要があります。次のようなもの(周波数領域): X -> H -> XH どこにX放射された信号はH、スピーカーの伝達関数であり、XHあるX回H。除算(./)が与えられますH。 ここで、キャリブレーションされた信号を送信するには、次のように分割する必要がありますH。 X/H -> H -> X 何が行われたか 三脚に1 m間隔でスピーカーと校正済みマイクを配置しました。 記録された30+リニアスイープ150KHz-20KHz、長さ20ms、@ 500 KS / sで記録。 以下のMatlab / Octaveスクリプトを使用して信号を整列および平均化すると、スクリプトの下で結果の信号を確認できます。 files = dir('Mandag*'); rng = [1.5e6, 1.52e6]; [X, fs] = wavread(files(1).name, rng); X = X(:,1); for i=2:length(files) [Y, fs] = wavread(files(i).name, rng); sig = …

1
異なる位置で測定された信号のピークを自動的に分類するにはどうすればよいですか?
空間のさまざまな位置で、時間の経過とともに音を測定するマイクを持っています。録音されるすべての音は、空間内の同じ位置から発生しますが、ソースポイントから各マイクへの経路が異なるためです。信号は(時間)シフトし、歪む。先験的な知識を使用して、時間シフトを可能な限り補正しましたが、データにはまだ時間シフトが存在しています。測定位置が近いほど、信号は類似しています。 自動的にピークを分類することに興味があります。これは、以下のプロットの2つのマイク信号を「見て」、位置と波形から2つの主要な音があることを「認識」して、それらの時間位置を報告するアルゴリズムを探していることを意味します。 sound 1: sample 17 upper plot, sample 19 lower plot, sound 2: sample 40 upper plot, sample 38 lower plot これを行うために、各ピークの周りでチェビシェフ展開を行い、チェビシェフ係数のベクトルをクラスターアルゴリズムへの入力として使用することを計画していました(k-means?)。 ここに例として、2つのピーク(青い円)の周りの9つのサンプル(赤い)の5項チェビシェフシリーズで近似された2つの近くの位置(青い)で測定された時間信号の一部を示します。 近似はかなり良いです:-)。 しかしながら; 上のプロットのチェビシェフ係数は次のとおりです。 Clu = -1.1834 85.4318 -39.1155 -33.6420 31.0028 Cru =-43.0547 -22.7024 -143.3113 11.1709 0.5416 また、下のプロットのチェビシェフ係数は次のとおりです。 Cll = 13.0926 16.6208 -75.6980 -28.9003 0.0337 Crl =-12.7664 …

3
スレピアンウィンドウと一般化されたガウスウィンドウに関するいくつかの質問
私は scipy.signalのすべてのウィンドウ関数のドキュメントを追加しようとしていますが、これまで聞いたことのないSlepian(DPSSと同じ?)ウィンドウとGeneralized Gaussianウィンドウが表示されません。 p一般化されたガウスとwidthスレピアンには、あるタイプの形状パラメーターである2つの変数があります。(sigシグマ、標準偏差のように見えます。) 2つの質問: 私がリバースエンジニアリングして推測する代わりに、これらの変数が何と呼ばれ、何をしているのかを誰かが説明できますか? これらのウィンドウが何に役立つか、またはどこで使用されるかを説明できますか? def general_gaussian(M, p, sig, sym=True): """Return a window with a generalized Gaussian shape. The Gaussian shape is defined as ``exp(-0.5*(x/sig)**(2*p))``, the half-power point is at ``(2*log(2)))**(1/(2*p)) * sig``. """ if M < 1: return np.array([]) if M == 1: return np.ones(1, 'd') odd …

1
ビデオから数えた車両
免責事項:この質問をStackOverFlowに投稿しましたが、こちらの方が適していることがわかりました。 私は画像処理に少し慣れていないので、コードではなく、問題の最適な解決策を見つけることについてお聞きしたいと思います。いいアイデアはまだ思いつかなかったので、アドバイスをお願いしたいです。 私はOpenCVを使用して、ビデオファイルまたはライブカメラから車両を数えるプロジェクトに取り組んでいます。そのようなプロジェクトに取り組んでいる他の人々は、通常、動いているオブジェクトを追跡してからカウントしますが、その代わりに、私は別の視点で作業したいと思いました。以下に示すように、ユーザーにビデオウィンドウにROI(関心領域)を設定し、この領域でのみ作業するよう依頼します(理由は、フレーム全体を処理しないことやパフォーマンスの向上など)。(ユーザーは複数のROIを設定することができ、ユーザーはROIの高さを通常の車の約2倍に比例感で設定するように求められます。) これまでに、背景の更新、形態学的フィルター、しきい値処理、移動オブジェクトをバイナリイメージとして以下のような基本的な進歩を遂げました。 それらを行った後、私は最終的なしきい値処理された前景フレームの白ピクセルを数え、それが車であるかどうかを合計白ピクセル数をチェックすることで推定しようとしました(ROIの高さを知って静的計算により下限を設定しました) 。説明のために、サンプルグラフィックを描きました。 ご覧のとおり、白いピクセルを計算して、時間までに曲線を描くかどうかを確認し、車やノイズのようなものかどうかを判断するのは簡単でした。 問題 2台の車が同時にROIを通過するまで、私はかなり成功しました。私のアルゴリズムはそれらを1台の車として誤って数えました。私はこの問題にさまざまなアプローチを試みましたが、長い車のようにこれに似ていますが、満足のいく解決策が見つかりませんでした。 質問 このピクセル値カウントのアプローチでこのタスクを処理することは可能ですか?そうでない場合、何を提案しますか?

1
興味深いサウンドを作成するためにオーディオ信号で実行される操作の基本的なカテゴリは何ですか?
私はdspに非常に慣れていないので、この質問が意味があるかどうかはわかりません。 私が遭遇したオーディオdspへの限られた進出で: 周波数変調 振幅変調 添加剤合成 減算合成 私の質問は、これらは信号操作(特にオーディオ)の主な基本カテゴリですか? 言い換えれば、プラグインのフルスイートを備えたFL Studioが実行できるすべてのエフェクトと空想的なことを、上記の4つの操作の一連の組み合わせに分解できますか?それとももっとたくさんありますか?プラグインを備えた最新のDAWは、理論的にはこの方法で任意のカテゴリに分類できますか?上記の4つのカテゴリはそれ自体で意味がありますか?! 背景:基本的に、プログラミングとオーディオdspの両方を学習するプロジェクトとして、非常に基本的な(ただし非常に柔軟な)オーディオシンセサイザ/エディタを作成しようとしています。Javaを使用して、基本的な現実世界のシンセサイザーのようなクラスを模倣し、OscillatorやLFOなどを呼び出すことから始めましたが、何か新しいことを学ぶたびに、新しい概念をプログラムに合わせるためにすべてを書き直さなければならないことに気づきます。 ここでもう一度始めて、プログラムの基本的なオブジェクトと構造を考え出そうとしています。これを適切に行うには、これらのオブジェクトがどのように相互作用することを許可する必要があるかを知る必要があります... ありがとう! 編集* * * 有用なコメントと回答をありがとう。私はおそらくdsp側の要素を過小評価していることに気づき、単純なシンセサイザの基本的なテンプレートと構造を作成してから、それを拡張/構築することはできません。新しいことや、物事を行うための「適切な」方法を学ぶとき、私はおそらく何度も何度も何度も再構築する必要があります...それはもっと時間がかかりますが、もっと学ぶでしょうか?また、申し訳ありませんが、まだ誰にも賛成できないほどの担当者がいないようです...できるだけ早く、そうします。 編集*編集*** 少しグーグルすると、この「合成のタイプ」へのこの基本的なガイドが明らかになり、関連性があり興味深いと思いました。

2
単純にデータをスケーリングすることによって振幅(およびおそらくFFT品質)を増やすことは有効ですか?
Mark Borgerdingによる "KISS FFT"のバージョンを使用しています。これは、16ビットの固定小数点入力値の配列を受け入れ、32ビットの浮動小数点結果配列を生成します。 入力振幅が低い場合、フロートの結果の値の多くがゼロになることがわかりましたが、単純に入力をスケーリングすると(たとえば、因数16)、出力値が少なくなるため、出力に含まれるようになりますより詳しく。(それは私の目的にとってあまり重要ではありませんが、一貫性のために、結果の浮動小数点値を同じスケーリング係数で除算します。) とにかく、これは機能しているように見えます。以前はほぼすべてゼロのバッファを取得していたのに結果を生成するという意味でですが、何らかの理由があり、有効なアプローチではないのではないかと思っています。 (このアプローチは、データの「粗さ」/粒度がはるかに多いことを意味します。特に、通常は存在する低レベルのノイズは存在しません。注入するのが賢明かどうか、ほとんど疑問に思っています。入力のゼロ値を置き換えるための低レベルのノイズ。)
10 fft 

1
CT再構成ボリュームでの解剖学的ランドマークの検出に関するアドバイス
私は、CT再構成ボリューム内のいくつかの医学的に定義された解剖学的ランドマークを自動的に検出しようとしています。医師はこれらのランドマークを使用して、いくつかの患者固有のパラメータを測定します。これらの解剖学的ランドマークは「キーポイント」の一種であるため、SIFT機能記述子を使用しようとしました。ランドマークは、SIFTで定義されている「注目点」ではない点(または小さな領域)であるため、これはあまりうまく機能しませんでした。多くのパターン/テンプレートマッチングアルゴリズムを探していましたが、回転/平行移動/スケールの問題がない場合、抽出された機能では各ランドマークが(残りのランドマークおよび残りの非ランドマークから)十分に区別されないことがわかりますランドマークパッチ)十分に機能する(少なくとも検出精度の80%)分類器をトレーニングします。 問題を十分に明確に述べていない場合はお知らせください。 アドバイスをいただければ幸いです。 ありがとう! 画像の例: 小さなxの十字と小さな四角が、検出したいランドマークの上にあります(ラベル付けされたランドマークを含むトレーニングセットがあることを忘れていました)。白い線は実行された対策を表します。これらはさまざまなケースの一部です(もちろん、3Dボリューム全体を投稿することはできません)。

2
信号源の2つの個別の母集団が混在している場合、独立したコンポーネント分析を使用できますか?
私は(ほとんど)独立成分分析(ICA)が1つの母集団からの信号のセットでどのように機能するかを理解していますが、私の観測(X行列)に2つの異なる母集団(異なる手段を持つ)からの信号が含まれている場合、それを機能させることができません。それがICAの固有の制限なのか、それとも私がこれを解決できるのか疑問に思っています。私の信号は、分析されている一般的なタイプとは異なります。私のソースベクトルは非常に短い(たとえば、3つの値が長い)のですが、多数(たとえば、1000)の観測があります。具体的には、幅広い蛍光信号が他の検出器に「波及」する可能性がある3色で蛍光を測定しています。私は3つの検出器を使用しており、粒子に3つの異なるフルオロフォアを使用しています。これは非常に貧弱な分解能分光法と考えることができます。任意の蛍光粒子は、3つの異なるフルオロフォアのいずれかの任意の量を持つことができます。ただし、蛍光体の濃度がまったく異なる傾向がある混合粒子のセットがあります。たとえば、1つのセットには通常、多くのフルオロフォア#1とほとんどないフルオロフォア#2がありますが、他のセットには#1がほとんどなく#2がたくさんあります。 基本的に、1つのフルオロフォアからの信号の一部を別のフルオロフォアの信号に追加するのではなく、スピルオーバー効果をデコンボリューションして、各粒子の各フルオロフォアの実際の量を推定します。これはICAで可能であるように思われましたが、いくつかの重大な失敗(行列の変換は、信号の独立性を最適化するために回転するのではなく、母集団の分離を優先するようです)の後で、ICAが適切なソリューションではないのか、それともこれに対処するために、他の方法でデータを前処理します。 グラフは、問題を実証するために使用した私の合成データを示しています。2つの母集団の混合からなる「真の」ソース(パネルA)から始めて、「真の」混合(A)行列を作成し、観測(X)行列を計算しました(パネルB)。FastICAはS行列(パネルCに表示)を推定し、私の真のソースを見つける代わりに、2つの母集団間の共分散を最小化するためにデータを回転させるように見えます。 提案や洞察を探しています。
10 ica 

2
時間周波数画像のノイズ除去について
ウェルチの方法を使用して作成された次の例の時間-周波数画像を「ノイズ除去」するためにどのような手法が利用できるのかと思います。次のプロットは、ロボットセンサーから作成されました。(これはカラーイメージではありません -グレースケールイメージです-色は視覚的な目的でのみ追加されます)。 ゴール: 私の目標は、最終的には、このようなパルスが存在する場合に、ここに表示されるパルス間隔を推定することです。これは鶏と卵のようなものかもしれません。そのため、私は自分に「この反復率+/- 10%のパルスが存在するのか」と自問し、それらを検出します。ここに表示されているのは信号(パルス)ですが、その他の不要な干渉があります。ただし、Emreが示唆したように、時間-周波数空間ではありますが、それらには構造があります。時間周波数フィルター自体は存在しますか? ここで適用される画像処理ソリューションを強く望んでいますが、どのようなソリューションでも受け入れられます。 したがって、目標は、反復パルス(y軸のインデックス300の近くにあります)を除いて、すべての高輝度信号を削除することです。他のすべての高強度信号は「干渉」と見なすことができます。 想定できること: ここに表示されているパルス長を大まかに知っていると想定するかもしれません。(+/- 10%以内としましょう)。言い換えれば、この長さのパルスを探すことにしました。(+/-) パルスの反復率も大まかに知っていると仮定することができます(ここでも、+ /-10%としましょう)。 残念ながら、あなたは彼らの頻度をもはや正確に知りません。つまり、この画像ではパルスは300にありますが、100、50、または489などに簡単に合わせることができます。ただし、良いニュースは、ここに示されている周波数は互いに非常に近いことです。 私のいくつかの考え: 画像処理POV: 形態学的な操作が私に起こりました、しかし、私はそれらがうまくいくかもしれないかどうかを知るためにそれらに精通しています。私はアイデアが「閉じる」ことで、それゆえ「より大きい」汚れを取り除くことであると思いますか? Row-wize DFT操作は、最も高い繰り返しパターンを持つ対象の行に基づいて、どの行をnullにするかを示す可能性がありますが、パルスが少なく、間隔が遠い場合や、画像のノイズが多い場合は、実行可能なソリューションにならない場合があります。 画像を見るだけで、分離を「報奨」し、接続を「罰する」ことを望んでいます。このような操作を行う画像処理方法はありますか?(再び自然の形態学)。 ここで役立つ方法は何ですか? 信号処理POV: ここに示されている周波数範囲はすでに非常に狭いため、ノッチフィルター操作が役立つかどうかはわかりません。さらに、この狭い範囲内で示されるパルスの正確な周波数は、事前にわかっていません。 ここで関心のあるパルス(長さと繰り返し時間)に基づいて推測を行うことで、「テンプレート」の2次元DFTを計算し、これを2D ケプストラル時間フィルターとして利用できます。上記のウェルチイメージを単純に乗算してから、逆2次元DFTを実行しますか? OTOH ガボールフィルターは、ここで良い一致でしょうか?結局のところ、これらは方向に敏感なフィルターであり、独自の組み込みV1ビジュアルプロセッサーに似ています。彼らはどのようにここで悪用される可能性がありますか? このドメインで役立つ方法は何ですか? 前もって感謝します。

1
制御システム設計における「ウォーターベッド効果」とは何ですか?
私は最近、「多変量制御システム」に関するMITコースのA. Megretskiによるいくつかのノートで、「 Watrbed 効果」に関するいくつかのノートを偶然見つけました。ここに抜粋があります: 開ループプラントの不安定な零点と極に通常関連する共通の影響により、特定の閉ループ伝達関数をすべての周波数で同時に「小さく」することは理論的に不可能になります。周波数応答の振幅がスペクトルの一部で減少する場合、それは他の部分で大きくなる必要があるかもしれません。ウォーターベッド効果と呼ばれることもあるこの効果は、閉ループ伝達関数に課せられる積分不等式によって数学的に説明できます。このような結果の基礎は、すべての可能な閉ループ応答のアフィン特性、および分析関数のコーシー積分関係です。 これまで聞いたことがないと思います。誰かがより実用的な用語で効果を説明できますか?実際にこの影響に遭遇する可能性があるのはいつですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.