タグ付けされた質問 「frequency-spectrum」

時間領域信号の周波数スペクトルは、周波数領域におけるその信号の表現です。

1
どの変換が人間の聴覚システムに最もよく似ていますか?
フーリエ変換は、一般的に音の周波数分析のために使用されています。ただし、音の人間の知覚を分析することになると、いくつかの欠点があります。たとえば、周波数ビンは線形ですが、人間の耳は周波数に線形ではなく対数的に応答します。 ウェーブレット変換は、フーリエ変換とは異なり、異なる周波数範囲の解像度を変更できます。プロパティは、ウェーブレット変換より高い周波数のための短い時間的幅を維持しながら、より低い周波数のための大規模な一時的なサポートを可能にします。 ウェーブレットモレット密接に聴力の人間の知覚に関連しています。音楽の転写に適用でき、フーリエ変換技術では不可能な非常に正確な結果を生成します。各音の開始時間と終了時間を明確にしながら、繰り返して交互に繰り返される音符の短いバーストをキャプチャできます。 定Q変換(密接ウェーブレットモレットに関連する)もされてよく演奏データに適しました。変換の出力は対数周波数に対して効果的に振幅/位相であるため、特定の範囲を効果的にカバーするために必要なスペクトルビンが少なくなります。これは、周波数が数オクターブにわたる場合に役立ちます。 この変換では、周波数ビンが高くなると周波数分解能が低下します。これは、聴覚アプリケーションに適しています。これは人間の聴覚システムを反映しており、低周波数ではスペクトル解像度が向上し、高周波数では時間解像度が向上します。 私の質問はこれです:人間の聴覚システムを密接に模倣する他の変換はありますか?解剖学的/神経学的に人間の聴覚系に可能な限り厳密に一致する変換を設計しようとした人はいますか? たとえば、人間の耳は音の強さに対して対数応答することが知られています。等ラウドネスの等高線は、強度だけでなく、スペクトル成分の周波数の間隔によっても変化することが知られています。多くの重要な帯域のスペクトル成分を含む音は、総音圧が一定のままであっても、より大きな音として知覚されます。 最後に、人間の耳には、周波数に依存する時間分解能が制限されています。おそらくこれも考慮に入れることができます。

2
単純なFFT振幅スペクトルの代わりにPSDを計算する必要があるのはいつですか?
44.1 kHzでサンプリングされた32秒の音声信号があります。ここで、音声の周波数を示したいと思います。しかし、私はそれを行うための最良の方法が何であるかわからない。フーリエ変換の絶対値を計算することもあれば、パワースペクトル密度を計算することもあります。正しく理解できれば、後者が機能するため、信号を部分に分割し、FFTを部分ごとに実行し、何らかの方法でこれらを合計します。ウィンドウ関数は何らかの形で関与しています。これを少し明確にできますか?DSPは初めてです。


1
曲内の数学関数を認識する
私はDSPを初めて使用しますが、このStackExchangeを発見したばかりなので、この質問を投稿するのにふさわしくない場合はおologiesびします。 より数学的な用語でジャンルを説明するリソースはありますか?たとえば、曲のこのセクションの信号でFFTを実行した場合(リンクがそこから開始しない場合は2:09)、このセクションにその大まかな種類があることを検出できる方法はありますか音の?このような音は、私が比較できる数学関数に従っていますか? http://www.youtube.com/watch?v=SFu2DfPDGeU&feature=player_detailpage#t=130s(リンクはすぐにサウンドの再生を開始します) 教師あり学習テクニックを使用する唯一の方法ですか、それとも別のアプローチがありますか(好ましくは、監視を必要としません)? アドバイスありがとうございます。

3
周波数分解能が良い場合、ゼロパディング後にDFTで周波数リークが発生するのはなぜですか?
この例を考えてみましょう: Fs=1000; Ns=500; t=0:1/Fs:(Ns-1)*1/Fs; f1=10; f2=400; x=5+5*sin(2*pi*f1*t)+2*sin(2*pi*f2*t); X=fft(x); このシナリオでは、周波数分解能は2で、すべての周波数成分が正しくキャプチャされています。ただし、これを行うと: X=fft(x,1000); 周波数分解能は1ですが、スペクトル漏れがあります。ここでも同様の効果が見られます。両方のウィンドウのフーリエ変換(1つは長さ500、もう1つは長さ1000)は、信号で示される周波数でゼロを持っているように思えます。そのため、リークが発生する理由がわかりません。

3
(実際の)正弦波のトーンとパルスの帯域幅はどれくらいですか?
次の帯域幅を計算する方法を教えてください。 一定の(実際の)正弦波のトーン (実際の)正弦波パルス。 質問はそれと同じくらい簡単ですが、一定のトーンの帯域幅を正確に何から始めるべきか、そしてそこから、パルスの帯域幅がどうあるべきかという概念に苦労しています。 周波数領域では、周波数一定の実音は、とある2つのデルタ関数として存在しますが、その帯域幅を計算するにはどうすればよいでしょうか。f − fffffff−f−f-f さらに、パルスに関しては、これは時間的には長方形の関数なので、周波数領域ではsincであるため、その帯域幅は単純にではなく、はパルスの持続時間ですか? T1T1T\frac{1}{T}TTT

4
DFT-畳み込みを使用したスペクトルドメインのウィンドウ効果の削除
DFTのウィンドウ処理の件について考えていたとき、思いついた。DFTは、使用されるウィンドウのスペクトルで畳み込まれた信号のスペクトルを生成します。したがって、メインローブとサイドローブがあります。 信号とウィンドウスペクトルの大きさの両方を再度畳み込むことで、信号のスペクトルに対するウィンドウ効果を取り除くことができると考えました。次の画像からわかるように、実際に機能しました。 左は、ハニングウィンドウで生成された元のスペクトルです。右は、ハニングウィンドウのDFTによって畳み込まれたスペクトルです。上はスペクトル自体、下はMATLABのfindpeaks結果です。 私はこのテクニックに関して何も読んだことがありませんが、私はそこに何も発明していないと確信しています。したがって、この処理をスペクトルで実行することの利点があるのか​​、それとも私には見られない欠点があるのか​​と思います。 私が見るところから見ると、前の画像でわかるように、これはピーク検出に役立ちます。また、次の2つの画像でわかるように、スペクトルが少し歪んでいるように見えます。: 青いグラフはスペクトル、赤いグラフは畳み込み後のスペクトルです。 これについて何か考えはありますか? このFFT後の畳み込みから発生する可能性のある問題はありますか? 主題を扱う紙はありますか? 編集 次のグラフを生成するスクリプトがここにあります。

2
時間周波数画像のノイズ除去について
ウェルチの方法を使用して作成された次の例の時間-周波数画像を「ノイズ除去」するためにどのような手法が利用できるのかと思います。次のプロットは、ロボットセンサーから作成されました。(これはカラーイメージではありません -グレースケールイメージです-色は視覚的な目的でのみ追加されます)。 ゴール: 私の目標は、最終的には、このようなパルスが存在する場合に、ここに表示されるパルス間隔を推定することです。これは鶏と卵のようなものかもしれません。そのため、私は自分に「この反復率+/- 10%のパルスが存在するのか」と自問し、それらを検出します。ここに表示されているのは信号(パルス)ですが、その他の不要な干渉があります。ただし、Emreが示唆したように、時間-周波数空間ではありますが、それらには構造があります。時間周波数フィルター自体は存在しますか? ここで適用される画像処理ソリューションを強く望んでいますが、どのようなソリューションでも受け入れられます。 したがって、目標は、反復パルス(y軸のインデックス300の近くにあります)を除いて、すべての高輝度信号を削除することです。他のすべての高強度信号は「干渉」と見なすことができます。 想定できること: ここに表示されているパルス長を大まかに知っていると想定するかもしれません。(+/- 10%以内としましょう)。言い換えれば、この長さのパルスを探すことにしました。(+/-) パルスの反復率も大まかに知っていると仮定することができます(ここでも、+ /-10%としましょう)。 残念ながら、あなたは彼らの頻度をもはや正確に知りません。つまり、この画像ではパルスは300にありますが、100、50、または489などに簡単に合わせることができます。ただし、良いニュースは、ここに示されている周波数は互いに非常に近いことです。 私のいくつかの考え: 画像処理POV: 形態学的な操作が私に起こりました、しかし、私はそれらがうまくいくかもしれないかどうかを知るためにそれらに精通しています。私はアイデアが「閉じる」ことで、それゆえ「より大きい」汚れを取り除くことであると思いますか? Row-wize DFT操作は、最も高い繰り返しパターンを持つ対象の行に基づいて、どの行をnullにするかを示す可能性がありますが、パルスが少なく、間隔が遠い場合や、画像のノイズが多い場合は、実行可能なソリューションにならない場合があります。 画像を見るだけで、分離を「報奨」し、接続を「罰する」ことを望んでいます。このような操作を行う画像処理方法はありますか?(再び自然の形態学)。 ここで役立つ方法は何ですか? 信号処理POV: ここに示されている周波数範囲はすでに非常に狭いため、ノッチフィルター操作が役立つかどうかはわかりません。さらに、この狭い範囲内で示されるパルスの正確な周波数は、事前にわかっていません。 ここで関心のあるパルス(長さと繰り返し時間)に基づいて推測を行うことで、「テンプレート」の2次元DFTを計算し、これを2D ケプストラル時間フィルターとして利用できます。上記のウェルチイメージを単純に乗算してから、逆2次元DFTを実行しますか? OTOH ガボールフィルターは、ここで良い一致でしょうか?結局のところ、これらは方向に敏感なフィルターであり、独自の組み込みV1ビジュアルプロセッサーに似ています。彼らはどのようにここで悪用される可能性がありますか? このドメインで役立つ方法は何ですか? 前もって感謝します。

3
クロマサブサンプリング:データレートを適切に計算する方法
たとえばY'UV画像でクロマサブサンプリングを利用するときにデータレートを計算する方法を理解するのに苦労しています。 以下の計算例があります。 画像解像度:352*288 周波数:25 fps 以下のために(:4:4 4)以下のように計算例を行きます: (352px * 288px) * 3 color channels * 25 fps * 8 bit = 60 825 600 bit/s ここまでは順調ですね。 しかし、今来る(4:2:0): (352px*288px) * 1.5 color channels * 25 * 8 = 30 412 800 bit/s さて、この例を例(4:1:1)に変換しようとすると、1.5カラーチャネルの比率がどのように計算されるかを正しく理解しているかどうかわかりません。 計算の最初の推測は(4:2:0)の場合でした: 2/4*3=1.5 color channels 同様に(4:1:1)の場合、カラーチャネルの比率を次のように計算します。 1/4*3=0.75 color channels …

1
スペクトログラムの作成
私はこのタスクのロジックを考え出そうとしており、KissFFTソースパッケージを使用して高速フーリエ変換を実行することを計画しています。これが正しいと思われる場合はお知らせください: FFT構造を割り当てます。私が使用しているウィンドウサイズはkiss_fft_alloc(N,0,NULL,NULL) どこですかN。入力バッファはN、タイプの要素の配列になりますkiss_fft_scalar。出力バッファはN/2 + 1、タイプの要素の配列になりますkiss_fft_cpx。 NPCMサンプルの数(ウィンドウサイズ)をデコードします。 各PCMサンプルについて、各チャネルの振幅(符号なしサンプル)を平均し、0から2にスケーリング(65536.0で除算)して、結果を入力バッファーに格納します。 入力バッファでウィンドウ処理(つまり、ハニング)を実行します。 入力バッファーで高速フーリエ変換を実行し、出力バッファーに格納します。実際の値を入力として使用しているため、を使用できますkiss_fftr()。 N/2出力値については、変換されたデータの2乗された大きさを取得し、次の式を使用して値をdBスケールに変換します。 10 * log10 (re * re + im * im) N/2手順6 の値をプロットします。 入力バッファの前半を破棄し、次の(ウィンドウサイズ/ 2)PCMサンプルをデコードして、データのスケーリングとウィンドウ処理を実行します。これにより、入力ウィンドウが効果的にスライドし、処理されたPCMサンプルの計算をやり直す必要がなくなります。 ステップ5にループし、すべてのサンプルが処理されるまでこれらのステップを繰り返します。 使用済みメモリをから解放しkiss_fft_alloc()ます。 FFTを実行する前に、入力ウィンドウから値を減算して、結果のDC値の大きさがゼロになるようにすることが提案されました。入力データから平均または平均を差し引くべきですか? また、ウィンドウサイズを選択するときに考慮する必要があることは何ですか?それ以外に、KissFFTの指示に従って偶数にする必要がありますが、小さなウィンドウサイズを使用することには利点があります。それはより良いグラフを提供しますか?ウィンドウサイズを大きくすると、実行する必要があるFFTの数が減ると思いますが、ウィンドウサイズを大きくすることの唯一の利点は何ですか。 xxx 提供できるあらゆるガイダンスを事前に感謝します。

2
ピッチ検出における高調波製品スペクトルの制限
HPSを使用してピッチ検出アルゴリズムを作成しましたが、問題に直面しています。私は信号処理の初心者ですが、このサイトは以前から役に立ちました。 より高いピッチ(eg. >C6:1046.50hz)については、HPSからガベージデータを取得し始めています。ピッチが高いほど、多くのゴミが発生します(ゴミとは、オクターブエラーや高調波ではなく、約1Hz〜20Hzの周波数を意味します) 私が経験的に観察したこと: ピッチが高くなると結果は最悪になります。ファンダメンタルズがA6程度以上の場合、ガベージデータのみを取得します。 FFTは、非常に高いピッチでも正常に機能します(細かく言うと、ピークは基本波またはその高調波のいずれかを示しますが、ガベージは示しません)。 HPSで考慮する高調波の数を減らすと、ゴミは減りますが、基本波と高調波を区別するのが難しくなります。 これが私のアルゴリズムです: ->raw buffer -> hann window, 16384 samples, 50% overlap -> zero padding -> FFT -> HPS どんな助けでもありがたいです! 更新1:では、追加したいことがいくつかあります。 私が記録しているサンプルレートは44100 Hzです この振る舞いはギターではほとんど見えないが、デジタルピアノでは非常によく見えることを確認しました(同じ演奏ノートに対して) これが私のhpsアルゴリズムです、多分経験のある人が問題を見つけることができます。 int hps(float* spectrum, int spectrumSize, int harmonics) { int i, j, maxSearchIndex, maxBin; maxSearchIndex = spectrumSize/harmonics; maxBin = 1; for …

2
複雑な信号のパワースペクトルで負の周波数をどのように処理しますか?
私たちは、実際の信号にDFT演算を適用するとを得るためにX [ kは]、その後の正方形の大き取るX [ kは]、| X [ k ] | 2、パワースペクトルは対称です。X [ k ]の周波数情報として、正の周波数または負の周波数を使用できます。x[n]x[n]x[n]X[k]X[k]X[k]X[k]X[k]X[k]|X[k]|2|X[k]|2\lvert X[k]\rvert^2X[k]X[k]X[k] ただし、これは複雑な値の信号には当てはまりません。パワースペクトルは対称的ではありません。 この場合、元の信号の周波数成分をどのように決定しますか? 負の周波数部分だけを落とせますか?

1
異なる音波波形を区別するための特徴ベクトルの設計
次の4つの波形信号を考えてみます。 signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 164.5383 171.8134 178.3905 180.8994 172.1375 149.2719 …

3
「スペクトルモーメント」とはどういう意味ですか?
私はグーグルとウィキの全能の神託を調べましたが、「スペクトルの瞬間」というフレーズの定義を見つけることができないようです。 私が読んでいるレガシーの作業テキストは次のように使用し、単位時間あたりのゼロクロッシングの数を次のように定義しています。 N0=1π(m2m0)1/2N0=1π(m2m0)1/2 N_0 = \frac1{\pi} \left(\frac{m_2}{m_0}\right)^{1/2} 次に、単位時間あたりの極値の数をさらに次のように定義します。 Ne=1π(m4m2)1/2Ne=1π(m4m2)1/2 N_e = \frac{1}{\pi}\left(\frac{m_4}{m_2}\right)^{1/2} 「mimim_iはスペクトルのiii番目のモーメントです」と最終的に言います。 誰もがこれに遭遇しましたか?スペクトルの「瞬間」とは何ですか?DSPの文献では、これについて聞いたことがありません。

3
スペクトルホワイトニングとは何ですか?
DSPの「スペクトルホワイトニング」とはどういう意味ですか? 画像処理で使用した場合、スペクトルホワイトニングはどのような影響がありますか?(視覚的またはその他...) スペクトルのホワイトニングは、オーディオの処理や分析のどこに役立つでしょうか?スペクトル的に白色化されたオーディオ信号はどのように聞こえますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.