信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

8
コンピューターステレオビジョン技術はサブミリメートル測定に適していますか?
私はオブジェクトを撮像し、この画像の特徴の高さをサブミリメートルの精度に導きたいプロジェクトを持っています(正確にはまだ正確にはまだ決定されていませんが、今のところ100分の1ミリメートルとしましょう) 。 私は、直接レーザー測距技術が適切でないことを以前にアドバイスされました 移動時間が短すぎるため、正確な計算を行うには精度が高すぎます マイナーな振動(装置の近くを歩く人など)は結果を混乱させます 私は約1000ドルで販売され、精度を達成できるが振動の問題に悩まされているレーザー装置を観察しました(これは問題ありません。装置を機械的に分離することも別の議論です)。 私は、より費用効果の高い結果を達成することを望み、ステレオビジョンを代替として考えました。この分野の初心者であるため、目的の精度を達成できるかどうかはわかりません。 (少なくとも)理論的には望ましい精度ですか? このトピックをさらに説明するのに役立つ推奨論文またはリソースはありますか? その他の注意事項 問題のオブジェクトは、約1/2 "正方形から約2 1/2"正方形までの範囲で、厚さが非常に薄い(1/16 "?)場合があります。機能はかなり荒いものになります(一般的に急激な移行)8月17日11:00 「より難しい」興味深いオブジェクトの1つは、高さ1.25mmの約20mmの正方形です。問題の表面特徴は、私が見積もっている.1-.3mmのオーダーです。カメラの位置は、おそらく上記の6インチのオーダーになります。これにより、より良い洞察が得られますか?8月17日15時15分 単一のプロファイル/レリーフ測定を実行するのではなく、オブジェクトの表面高さマップを生成しようとしています。全体的なプロファイルと同様に、オブジェクトの表面の特徴は非常に重要です。

4
ウェーブレット変換はどの時間周波数係数を計算しますか?
高速フーリエ変換かかりしながら、動作を高速ウェーブレット変換をとるO(Nを)。しかし、具体的には、FWTは何を計算しますか?O(NlogN)O(Nlog⁡N)\mathcal O(N \log N)O(N)O(N)\mathcal O(N) それらはしばしば比較されますが、FFTとFWTはリンゴとオレンジのようです。私が理解しているように、STFT(経時的な小さなチャンクのFFT)と複雑なMorlet WTを比較する方が適切です。なぜなら、それらは両方とも複雑な正弦波に基づいた時間周波数表現であるからです)。多くの場合、これは次のような図で示されます。 (別の例) 左は、時間が経過するにつれてSTFTが積み重ねられた一連のFFTである様子を示しています(この表現はスペクトログラムの原点です)。右は、ダイアディックWTを示しています。低周波数での解像度(この表現はスカログラムと呼ばれます)。この例では、STFTのは垂直列の数(6)であり、単一のO(N log N ) FFT演算は、N個のサンプルからN 個の係数の単一の行を計算します。合計は、それぞれ6ポイントの8 FFT、または時間領域で48サンプルです。NNNO(NlogN)O(Nlog⁡N)\mathcal O(N \log N)NNNNNN わからないこと: 単一の FWT操作で計算される係数の数と、上記の時間周波数チャートのどこに位置していますか O(N)O(N)\mathcal O(N) 単一の計算で塗りつぶされる長方形はどれですか? 両方を使用して時間周波数係数の等面積ブロックを計算すると、同じ量のデータが出力されますか? FWTはFFTよりも効率的ですか? PyWaveletsを使用した具体例: In [2]: dwt([1, 0, 0, 0, 0, 0, 0, 0], 'haar') Out[2]: (array([ 0.70710678, 0. , 0. , 0. ]), array([ 0.70710678, 0. …
26 frequency  fft  wavelet 

5
エイリアシングはいつ良いことですか?
ハミングの本「科学と工学の実践」で、彼は次の話を述べています。 海軍大学院のグループは、サンプリング定理に従って理解できるように、非常に高い周波数の信号をサンプリングできる範囲まで変調していました。しかし、高周波を巧妙にサンプリングすると、サンプリング動作自体がそれを変調(エイリアス)することに気付きました。数日間の議論の後、彼らは周波数を下げる機器のラックを取り外し、残りの機器はより良く走りました! 回避すべき副作用とは対照的に、信号処理の主要な手法としてエイリアシングを使用する他の方法はありますか?

4
植物顕微鏡画像で気孔を見つける
画像処理の専門家への質問です。 私は難しいコンピュータービジョンの問題に取り組んでいます。タスクは、DIC顕微鏡画像で気孔(以下にマーク)をカウントすることです。これらの画像は、モルフォロジー演算やエッジ検出など、ほとんどの表面的な画像処理技術に耐性があります。また、他のセルカウントタスクとは異なります。 OpenCVを使用しています。私の計画は、気孔の識別に役立つ可能性のある機能を確認することです。 テクスチャ分類子 DCT(離散コサイン変換/周波数領域分析) LBP(ローカルバイナリパターン) HOG(方向付けられた勾配のヒストグラム) 堅牢な特徴検出器(私は懐疑的です) ハリスコーナー SIFT、SURF、STARなど Haarカスケード分類器/ Viola-Jonesの機能 そして、おそらく新しい機能記述子を設計します。今のところ、分類子の選択は省略しています。 私は何を見逃しましたか?これをどのように解決しますか?同様のオブジェクト検出問題の解決策は非常に役立ちます。 サンプル画像はこちら。 バンドパスフィルター後: キャニーエッジの検出は有望ではありません。一部の画像領域は焦点が合っていません。




4
1D信号を外挿するにはどうすればよいですか?
ある程度の長さの信号、たとえば1000サンプルがあります。この信号を5000サンプルに拡張し、元のサンプルと同じレートでサンプリングします(つまり、長時間サンプリングし続けた場合に信号がどうなるかを予測したい)。信号は、いくつかの正弦波成分を加算して構成されています。 最初に思いついた方法は、FFT全体を取得して拡張することでしたが、これによりフレーム1001で非常に強い不連続性が残ります。また、ピーク付近のスペクトルの一部のみを使用することも検討しました。信号をいくらか改善しますが、位相が正しいことが保証されているとは思えません。この信号を拡張する最良の方法は何ですか? 以下は、私が望む理想的な方法を示すMATLABコードです。もちろん、正確に3つの正弦波成分が存在することも、正確な位相と周波数があることも事前にはわかりません。関数が連続的であること、ポイント501に移動してもジャンプしないことを確認したい、 vals = 1:50; signal = 100+5*sin(vals/3.7+.3)+3*sin(vals/1.3+.1)+2*sin(vals/34.7+.7); % This is the measured signal % Note, the real signal will have noise and not be known exactly. output_vals = 1:200; output_signal = 100+5*sin(output_vals/3.7+.3)+3*sin(output_vals/1.3+.1)+2*sin(output_vals/34.7+.7); % This is the output signal figure; plot(output_signal); hold all; plot(signal); 基本的に、緑の線が与えられたら、青の線を見つけたいです。
25 matlab  sampling 

1
重複追加と重複保存
フィルタリングにオーバーラップ追加とオーバーラップ保存のどちらを使用するかを決定するために、どのような違いやその他の基準を使用できますか オーバーラップ加算とオーバーラップ保存の両方は、FIRフィルターカーネルによるデータストリームのFFTベースの高速畳み込みを行うためのアルゴリズムとして説明されています。遅延、計算効率、またはキャッシュの局所性(など)の違いはありますか?それとも同じですか?

3
一連の画像から3D構造を再構築するにはどうすればよいですか?
次のようにグループ化された輪郭のセット(線分セットのセット)があります。 Si={I0,Iπ4,I2π4,…,I7π4}Si={I0,Iπ4,I2π4,…,I7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} どこで S私SiS_iは、1つの具体的なオブジェクトの写真のシーケンスを示します。 私jIjI^jは視点を持つ画像を表します(は正面図を意味します)。 j = 0jt hjthj^{th}j = 0j=0j=0 (背面図)の例を次に示します。 私πIπI^\pi 与えられたでオブジェクトの3D構造をどのように再構築できますか?S私SiS_i 誰かが私にいくつかの論文を教えてくれたり、キーワードを教えてもらえますか?ポイントクラウドなどで動作する多くの記事があることは知っていますが、線で動作しているため、それらは機能しません。

3
オーディオのどの数学モデルが、(音色が複雑な)ポリフォニーの個々の音のピッチシフトを可能にしますか?
私の質問は次のとおりです。ポリフォニックアコースティック楽器の単一チャンネルのマルチボイスオーディオ録音で、個々の音符の変化(ピッチシフト)を可能にするポリフォニックサウンドの数学モデルは何ですか。「ポリフォニックオーディオのノートを変更する」とは、CeleonyのMelodyneソフトウェアのいわゆる「ダイレクトノートアクセス」機能でサウンドを編集するようなことを意味します。 ウィキペディアによると、Melodyneがアコースティック(したがって音色が複雑な)楽器で演奏される1行のメロディのオーディオ信号をモデル化するために使用するのは、ヘニングティーレマンが論文「モノフォニックサウンドの位相と時間のもつれを解く」で説明しているようなものですが、ポリフォニック楽器のオーディオ信号のモデルへの参照は見つかりません。Peter NeubackerのYoutubeのインタビュー(以下に転記)によると、ポリフォニックオーディオの編集を処理するMelodyneの機能には、Thielemannの説明とは異なるアプローチが必要です。 別のyoutubeクリップからの手がかりの1つは、ノイバッカーのモデルが1種類の楽器のみ(つまり、ピアノのみ、ギターのみ、弦のみ、風のみなど)のオーディオレコードでよりうまく機能することです。別の手がかりは、ノートのピッチをシフトするだけでなく、ノートの(開始および終了)タイミングもシフトする機能を示す別のクリップです。 以下は、「ポリフォニック素材には別のアプローチが必要」と述べたYouTubeビデオのトランスクリプトです(22:00から視聴する時間がない場合)。 Melodyneが発生した問題:このような[手で石を身振りで示す] 3次元形式からサウンドを取得するにはどうすればよいですか?それにより、音は連続時間への依存から解放されますか?この彫刻は、実際にこれから生まれたものです...それはプラスチックのかけらです...これは音楽データから直接派生しました。このオブジェクトは、この音を[リュートで音をたてて]います。このように、左から右に視覚化するのが最適です。時間はこの方向に進みます[左から右へのジェスチャー]。そして、それは振幅です(親指と反対の指で大きくも小さくもジェスチャーします)。私がそれを回すと、それは...任意のインスタンスでのこの音の音色を表します。ここでは、かなり三角形の構造[彫刻の下部​​の断面を指す]を非常に明確に見ることができます。それはこの音で、 Melodyneはまだ存在せず、サウンドをこの形状に変換する実験をしていたので、この1つのサウンドでほぼ1年間働きました。...私はこの音の内と外を心から知っています。これは、ローカルサウンドの良い例でもあります。[マウスをクリック]するだけでなく、任意のポイントのサウンドを入力し、好きなだけゆっくりとすばやく移動することもできます。音を残したり、前後に移動したりすることもできるので、ここで1か所を調べたら...回ります。... 10年前は新しいものでした。 最近、dna(直接メモアクセス)が追加されました。それにより、ポリフォニック音楽も編集できます。つまり、ギターの録音など、同時に聞こえる音を個別に編集できます。ここで小さなコードを演奏すると(画面で[ポリ]-> [音符を分離]を選択)、ここで演奏した3つの音符が個別のエンティティとして表示されます。もう一度聞いてみましょう[コンピューターはマイナーなコードを演奏します]。そして今、指をより高いフレットに移動するかのように、この1つの音を上げることができます[画面上の音を上にドラッグします。コンピューターが主要な和音を演奏する]。分割されたオーディオの場合、この1つのノートを分離し、任意のピッチに自由に上下させることができます。 以前は、この方法で複雑な素材内の個々のトーンを分離できなかったのはなぜですか?正直わかりません。科学では、自然な傾向は、単純なもの、たとえば正弦波、または個々の音で始まり、それを最初に分析して、材料がより複雑になるか、全体を処理する必要がある場合にのみシステムを検出することです動作しません。私のアプローチは異なります。私は実際には複雑な信号から始めますが、何かを詳細に調べたい場合にのみ、より単純な信号に戻りますが、最初に、実際に実際に何が起こっているのかについて全体的な印象を持たなければなりません。 秘密はおそらくこのロールにありますか?ふふ、これは実際にトイレットペーパーです。もともと石によって提起された問題は、どのようにして与えられた音を立体的な形に変換できるかということでした。ここでは、音の値をサンプリングする個人を配置しました。これは、ここでは1つ2つ3つで示され、螺旋状になっています。そして、ポイント間を補間すると[螺旋を横切る]、音の個々の断面を表す風景[彫刻の断面を示す]が現れます。 ロールは何歳ですか?12年間。その考えは、今日見たすべてのMelodyneの源泉です...?はい、しかし、音を巻き上げるこの方法は、ポリフォニック素材にはもはや使用できなくなり、異なるアプローチが必要になります。
24 frequency 

1
位置と速度のカルマンフィルター:速度推定の導入
昨日私のクエリにコメント/回答を投稿してくれたすべての人に感謝します(位置、速度、加速度のカルマンフィルターの実装)。私は、(a)の両方で推奨されていたものを見て、特にしてきた1次元位置と速度にWikipediaの例をしても同じようなことを考えて、別のウェブサイト。 アップデート2013年4月26日:ここでの元の質問には、1次元の位置と速度に関するウィキペディアの例を正しく理解していなかったという事実に関連するいくつかのエラーが含まれていました。何が起こっているのかについての理解が深まったので、質問を書き直し、より厳密に焦点を合わせました。 上記の導入部の段落で参照する例は両方とも、測定されるのは位置のみであると想定しています。ただし、どちらの例にも速度の計算がありません。たとえば、Wikipediaの例では、行列をとして指定します。これは、位置のみが入力されることを意味します。ウィキペディアの例に焦点を当て、状態ベクトルカルマンフィルタのは、位置含まと速度、すなわちH H = [ 1 0 ] X K X K ˙ X K(xk− xk − 1)/ dt(xk−xk−1)/dt(x_k-x_{k-1})/dtHH{\bf H}H =[10] H=[1 0]{\bf H} = [1\ \ \ 0]バツkxk{\bf x}_kバツkxkx_kバツ˙kx˙k\dot{x}_{k} バツk= (xkバツ˙k)xk=(xkx˙k) \begin{align*} \mathbf{x}_{k} & =\left(\begin{array}[c]{c}x_{k}\\ \dot{x}_{k}\end{array} \right) \end{align*} 時間での位置の測定値がます。次に、時間での位置と速度がおよびであり、が時間間隔からに適用される一定の加速度である場合、測定からはの値を推定することができます式を用いてX K K - 1 X K - 1 ˙ …

4
ピーク検出アプローチ
存在するピーク検出アルゴリズムは何ですか?ノイズの多いデータがあり、このデータのピーク検出を実装したいと思います。データは逆で、実際に私は底を決定しようとしています。 これがExcelのデータのスナップショットです。私は両方の底を検出するのが好きです。データをローパスフィルターに通してから、移動平均を行ってピークを決定し、移動平均内で別の検索を行うことを考えました。DSPバックグラウンドはゼロです。これは単なる常識的なアプローチです。専門家が推奨することを聞きたいです。

5
移動平均フィルター(FIRフィルター)に対する最良の1次IIR(ARフィルター)近似とは何ですか?
次の1次IIRフィルターを想定します。 y[n]=αx[n]+(1−α)y[n−1]y[n]=αx[n]+(1−α)y[n−1] y[n] = \alpha x[n] + (1 - \alpha) y[n - 1] IIRが最後のサンプルの算術平均であるFIRを可能な限り近似するパラメーター st を選択するにはどうすればよいですか。αα \alpha kk k z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1]z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1] z[n] = \frac{1}{k}x[n] + \frac{1}{k}x[n-1] + \ldots + \frac{1}{k}x[n-k+1] ここで、、つまりIIRの入力はよりも長くなる可能性がありますが、最後の入力の平均の最適な近似が必要です。n∈[k,∞)n∈[k,∞) n \in [k, \infty) kk k kk k IIRには無限のインパルス応答があるため、最適な近似を探しています。またはコスト関数のいずれであっても、分析ソリューションが必要です。L2L2 {L}_{2} L1L1 {L}_{1} この最適化問題は、1次IIRのみを与えられた場合、どのように解決できますか ありがとう。

1
ハリスの角点検出の数学
この質問は、Signal Processing Stack Exchangeで回答できるため、Stack Overflowから移行されました。 7年前に移行され ました。 これは、ハリスコーナー検出の数式です。 しかし、次の疑問があります。 とvの物理的な意味は何ですか?多くの参考文献は、それがウィンドウwがシフトする大きさだと言っています。それでは、ウィンドウはどのくらいシフトされますか?1ピクセルですか2ピクセルですか?uuuvvvwww ピクセル位置の合計はウィンドウでカバーされていますか? 単に仮定、I (X 、Y )における単一の画素の強度であり(X 、Y )または中心とするウィンドウ内の強度の和(X 、Y )?w(x,y)=1w(x,y)=1w(x,y) = 1I(x,y)I(x,y)I(x,y)(x,y)(x,y)(x,y)(x,y)(x,y)(x,y) Wikiによると、画像は2Dであり、Iで示され、エリア上の画像パッチを考慮するように求められ、I (x 、y )という表記を使用します。(x,y)(x,y)(x,y)I(x,y)I(x,y)I(x,y) 数学的な説明を理解するのはわかりにくいです。誰もがアイデアを持っていますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.