信号処理

信号、画像およびビデオ処理の芸術および科学の実務家のためのQ&A

3
SNRとPSNRの違い
SNRは信号電力とノイズ電力の比であることがわかりました。画像に関しては、追加されたノイズが元の画像にどのように影響するか。PSNRでは、画像のピーク値の2乗(8ビット画像の場合、ピーク値は255)を取り、それを平均2乗誤差で除算します。SNRとPSNRは、再構成後の画像の品質を測定するために使用されます。SNRまたはPSNRが高いほど、再構成が良好であることを理解しています。私が理解していないのは、SNRとPSNRが、再構成された画像に関する結論に関してどのように異なるかです。 同じ画像のSNRを結論付けることができないと、画像のPSNRは何を結論づけますか? PSNRの結論がSNRの結論とどのように異なるのでしょうか?

1
MFCCの計算/理解を支援:メル周波数ケプストラム係数
私はオンラインで細かく読んでいますが、すべてをつなげることはできません。私はこれに関する十分な前提条件である信号/ DSPスタッフの背景知識を持っています。私は最終的にこのアルゴリズムをJavaでコーディングすることに興味がありますが、まだ完全には理解していません。だから私はここにいるのです(数学としてカウントされますよね?)。 これが私の知識のギャップと一緒にどのように機能するかを示しています。 .wavファイルなどの音声スピーチサンプルから始めて、配列に読み込むことができます。この配列呼び出す、Nの範囲0 、1 、... 、N - 1(したがって、N個のサンプル)。値は、私が推測するオーディオの強度-振幅に対応しています。x [ n ]バツ[n]x[n]nnn0 、1 、... 、N− 10、1、…、N−10, 1, \ldots ,N-1NNN 音声信号を10ミリ秒程度の明確な「フレーム」に分割し、音声信号が「静止」していると想定します。これは量子化の形式です。したがって、サンプルレートが44.1KHzの場合、10msは441サンプル、つまり値に等しくなります。x [ n ]バツ[n]x[n] フーリエ変換(計算のためにFFT)を行います。これは、信号全体または各個別のフレームで実行されますか?一般にフーリエ変換は信号のすべての要素を見るので、違いがあると思うので、F(x [ n ] )≠ F(x 1 [ n ] )はFと結合(x 2 [ n ] )は… Fと結合(x N [ n ] )ここでxx [ n ]バツ[n]x[n]F(x [ n …

2
ノイズの多い画像データでの円の検出
次のような画像があります。 円の半径(または直径)を見つけようとしています。(matlab'sを介して)円形のハフ変換を使用imfindcircles(bw,[rmin rmax],'ObjectPolarity','bright')して、円または楕円(ノイズの少ないデータで非常にうまく機能する自家製の関数、以下を参照)に適合させてみました。 また、より明確な円を得るためにいくつかの画像処理を試しました。たとえば、以下を参照してください。 se = strel('disk', 2); bw = imdilate(bw, se); bw = bwareaopen(bw,100000); bw = edge(bw); ただし、処理された画像をいずれかの手法(ハフと円\楕円のフィッティング)にフィードすると、どちらも適切な方法で円を検出できません。 これが、私が書いたサークルファインダーのコードスニペットです(matlab)[row col] = find(bw); contour = bwtraceboundary(bw、row(1)、col(1)]、 'N'、接続性、num_points); x = contour(:,2); y = contour(:,1); % solve for parameters a, b, and c in the least-squares sense by % using the backslash …

5
非常に基本的な用語で平滑化とは何ですか
スムージングとは何ですか? Matlabには音声信号の振幅スペクトル(FFTの128ポイントの振幅)である配列があります。移動平均を使用してこれをどのように滑らかにしますか?私が理解したことから、特定の数の要素のウィンドウサイズを取り、平均を取る必要があり、これが新しい最初の要素になります。次に、ウィンドウを1つの要素だけ右に移動し、2番目の要素になる平均値を取得します。それは本当にそれがどのように機能するのですか?私がそれを行うと、最終結果では128要素未満になるので、自分自身はわかりません。それでは、どのように機能し、データポイントを滑らかにするのにどのように役立ちますか?または、データの平滑化を行うことができる他の方法はありますか? 編集:フォローアップの質問へのリンク

1
実際のカルマンフィルター
カルマンフィルターの説明を読みましたが、実際にどのように組み合わされるかについては明確ではありません。線形状態遷移が必要であり、同じ理由で異常検出や状態遷移の特定に役立たないため(線形状態遷移が必要)、主に機械システムまたは電気システムをターゲットにしているようです。実際には、カルマンフィルターを使用するために事前に既知であると予想されるコンポーネントをどのように見つけるのが一般的ですか。コンポーネントをリストしましたが、事前に知っておくべきことの理解が間違っている場合は修正してください。 これらを「事前に」知る必要はないと思います。 プロセスノイズww\mathbf w 観測ノイズvv\mathbf v 実際の状態(これは、カルマンフィルターが推定しようとするものです)xx\mathbf x カルマンフィルターを使用するには、これらを「事前に」知る必要があると思います。 に適用する線形状態遷移モデル(これを事前に知る必要があるため、状態は既知の法則に準拠する必要があります。つまり、カルマンフィルターは、ある状態から別の状態への遷移がよく理解され、わずかなノイズまで決定論的-異常を発見したり、ランダムな状態変化を見つけるツールではありません)xx\mathbf x 制御ベクトルuu\mathbf u 制御ベクトル適用される入力モデルを制御します(これを事前に知る必要があるため、カルマンフィルターを使用するには、制御値がモデルにどのように影響するかを最大である程度のガウスノイズまで事前に知る必要があります。効果は線形である必要があります)uu\mathbf u プロセスノイズの共分散(ウィキペディアの記事では時間に依存しているように見えます。つまり、時間kに依存します)-事前に、また時間をかけてこれを知る必要があるように見えますが、実際には一定であると見なされます?QQ\mathbf Qkkk (線形)観測モデルHH\mathbf H 共分散(ウィキペディアの記事でも時間に依存しているようです)-Qと同様の問題RR\mathbf RQQ\mathbf Q PSそして、はい、これらの多くは時間に依存していることを知っています。すべての添え字が散らかっただけです。必要に応じて、各変数名の右下の小文字を自由に想像してください。kkk

3
人間の音声ノイズフィルター
誰もが非音声を減衰させるフィルターを知っていますか?私は音声認識ソフトウェアを書いていますが、人間の音声以外はすべて除外したいと思います。これには、バックグラウンドノイズ、くだらないマイクによって生成されるノイズ、またはバックグラウンドミュージックも含まれます。パワースペクトルの6 dBロールオフを補正する1次フィルターを既に実装していますが、ノイズが聞こえます(ただし、音声はずっと明瞭に聞こえます)。ローパスフィルターを使用することを考えましたが、次の2つの理由でそれを行うのは不安です。 ローパスプレフィルターが残りの音声処理に干渉するかどうかはわかりません。人間の耳は20 kHz未満の音しか検出できませんが、音声の処理に必要な高次の高調波を除去するリスクはありません(これが事実かどうかはわかりませんが。私はチャンスを取りたくない)。 特定の子音(f、h、sなど)の励起は、ほぼ完全にホワイトノイズであることを理解しています。いわば、良いノイズを除去するノイズフィルターを実装したくありません。 理想的には、マイクに向かって話している人のスピーチだけを残したいと思います。あなたが何かアイデアを持っているか、私が見逃している何かがある場合、私に知らせてください。大変感謝いたします!

1
エラーサーフェスコンベックスの原因は何ですか?それはコバリンス行列またはヘッセ行列によって決定されますか?
現在、回帰の最小二乗(および他の)推定について学習しています。また、いくつかの適応アルゴリズムの文献でも読んでいるところから、「... and error surface isconvex ...」というフレーズが表示され、そもそも凸である理由についての深さはどこにも見当たりません。 ...だから、それを正確に凸状にするのは何ですか? 私は自分のコスト関数で自分の適応アルゴリズムを設計できるようにしたいので、この繰り返しの省略はやや面倒ですが、コスト関数が凸誤差曲面を生成するかどうかわからない場合、私はすることができませんグローバルな最小値はないので、勾配降下のようなものを適用するのは遠すぎます。たぶん私は創造的になりたい-たぶん、私はエラー基準として最小二乗を使いたくないでしょう さらに掘り下げてみると(そして私の質問はここから始まります)、凸状のエラーサーフェスがあるかどうかを判断するには、ヘッセ行列が正の半正定行列であることを確認する必要があります。対称行列の場合、このテストは簡単です-ヘッセ行列のすべての固有値が非負であることを確認してください。(行列が対称でない場合、Gramianにより、行列を独自の転置に追加して同じ固有値検定を実行することで対称にすることができますが、ここでは重要ではありません)。 ヘッセ行列とは何ですか?ヘッセ行列は、コスト関数の部分の可能なすべての組み合わせを成文化します。パーシャルはいくつありますか?フィーチャベクトル内のフィーチャの数。パーシャルの計算方法は?元のコスト関数から「手動」で偏導関数を取得します。 それがまさに私がやったことです:マトリックスXで示されるmmm x nnnデータマトリックスがあると仮定します。ここで、mは例の数を示し、nは例ごとの特徴の数を示します。(これはパーシャルの数にもなります)。私は、我々が持っていると言うことができると仮定メートルの時間サンプルおよびnは、センサからの空間サンプルを、物理的なアプリケーションは、ここではあまり重要ではありません。XXXmmmnnnmmmnnn さらに、サイズm x 1のベクトルもあります。(これは「ラベル」ベクトル、またはXのすべての行に対応する「答え」です)。簡単にするために、この特定の例ではm = n = 2と仮定しました。したがって、2つの「例」と2つの「機能」です。yyymmm111XXXm=n=2m=n=2m=n=2 ここで、ここで最適な「ライン」または多項式を確認したいとします。つまり、コスト関数が次のようになるように、多項式係数ベクトルに対して入力データフィーチャを投影します。θθ\boldsymbol{\theta} J(θ)=12m∑i=1m[θ0x0[i]+θ1x1[i]−y[i]]2J(θ)=12m∑i=1m[θ0x0[i]+θ1x1[i]−y[i]]2 J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} \bigg[\theta_{0}x_{0}[i] + \theta_{1}x_{1}[i] - y[i]\bigg]^{2} 今、私たちが最初の偏微分WRTみましょうしたがって、(機能0):θ0θ0\theta_{0} δJ(θ)δθ0=1m∑i=1m[θ0x0[i]+θ1x1[i]−y[i]]x0[i]δJ(θ)δθ0=1m∑i=1m[θ0x0[i]+θ1x1[i]−y[i]]x0[i] \frac{\delta J(\theta)}{\delta\theta_0} = \frac{1}{m}\sum_{i=1}^{m} \bigg[\theta_{0}x_{0}[i] + \theta_{1}x_{1}[i] - y[i]\bigg] x_{0}[i] δJ(θ)δθ0=1m∑i=1m[θ0x20[i]+θ1x1[i]x0[i]−y[i]x0[i]]δJ(θ)δθ0=1m∑i=1m[θ0x02[i]+θ1x1[i]x0[i]−y[i]x0[i]] \frac{\delta J(\theta)}{\delta\theta_0} = \frac{1}{m}\sum_{i=1}^{m} \bigg[\theta_{0}x_{0}^{2}[i] + …

3
非対称ウィンドウを使用したFFT?
一般的な非矩形ウィンドウ関数はすべて対称に見える。FFTの前に非対称ウィンドウ関数を使用したい場合はありますか?(FFTアパーチャの片側のデータがもう一方のデータよりも少し重要である、またはノイズが少ないなど) もしそうなら、どんな種類の非対称窓関数が研究されており、それらは(より損失の多い)オフセット対称窓と比較して周波数応答にどのように影響しますか?

4
画像から影を削除するにはどうすればよいですか?
この画像があります 画像から影を取り除きたいです。特定の形態学的操作などのさまざまな方法を使用して、シャドウを削除していることを知っています。 同じ画像用にこのマスクを作成しました 私が作成したこのマスクを使用して試すことができる他の方法はありますか? 編集: 要求されたものと同じサイズの入力画像とマスク: 編集2:1D不変画像を生成しましたが、完璧ではありません I = imread('shadow.jpg'); J = im2double(I); R = J(:,:,1); G = J(:,:,2); B = J(:,:,3); [len,wid] = size(R); % Generation of 2-D Log Chromaticity Image. for i = 1:len for j = 1:wid if ((R(i,j)*G(i,j)*B(i,j))~= 0) c1(i,j) = R(i,j)/((R(i,j)*G(i,j)*B(i,j))^(1/3)); c2(i,j) = G(i,j)/((R(i,j)*G(i,j)*B(i,j))^(1/3)); c3(i,j) …

2
調整可能なバタワースフィルターの標準的な実装形式はありますか?
バターワースフィルターを実装する標準的な方法の1つは、それぞれが複素共役極のペアに対応する2次セクションのカスケードです。たとえば、4次フィルターの場合、2つの2次セクションがあります。カットオフが0hz付近からナイキスト付近に設計されているため、z平面でローパスフィルターの極の位置がどのように変化するかを考えると、極の各ペアによって「掃引」されるパスは、単位円内のアークのペアに対応します、次の図に示すように[4次フィルターの場合]: これらのフィルターがどのくらいの期間存在し、これらの「アーク」がs平面の直線に対応するという事実を考えると、ポールをスイープできる単一のパラメーターを持つ実装フォームを誰かが開発したのは理にかなっています「設計時」ではなく「実行時」の円弧に沿って。しかし、私はまだそのようなものに遭遇していません。 特に範囲のセグメント内でこれを行うさまざまな方法を考え出すことは比較的簡単で、少し余分な計算を投げる意欲があります。私が疑問に思っているのは次のとおりです: 1)最適な特性(効率、堅牢性など)を持ち、2)範囲全体をカバーする、特定の次数の調整可能な[デジタル]バタワースフィルターを実装する標準的な方法はありますか? または、これは本当に簡単な問題なので、誰もそれについて話すことを気にしませんか?その場合、「静的」設計のオプションの横にあるフィルター設計プログラムに表示されるようです。 私はこれを見つけました:可変カットオフ周波数を備えた多目的バターワースフィルターですが、最初はグーグルで何が含まれているかについての情報はあまりないようです。 更新(再:回答) もう少し明確にするために: 私は、時変システムで使用するために、DCからナイキストへのカットオフを自動的に調整する(ゲインを正規化したままにする)パラメーター([0,1]など)を持つ「メタ設計」を探しています。バターワース制約を除いて、この2極共振器のようなもの。アイデアは、パラメータを計算することは、実行時に一般的なオフライン設計手順を実行するよりも効率的であるということです。 「メタフィルタ」の設計方法を必ずしも探しているわけではありません(つまり、数値の代わりに変数を使用して計算を行います)。標準の[非自明]実装形式の選択肢があるかどうか疑問に思っています。たとえば、静的な場合に対応する単純なアプローチでは、時変の場合に数値的な問題が発生します。 たぶん問題はないかもしれませんし、簡単なアプローチが実際に使用されているものです。それは素晴らしいことです。私が心配しているのは、私が相談した情報源のどれにもこのトピックが明示的に言及されていないことですが、たぶん本当に明白な何かを見逃したので、私は尋ねています。 ここで詳細を追加する過程で、私はパラメトリックバイクアッド構造の一般的な処理に遭遇しました。 更新2 次のように、Jason Rへの2番目のコメントに入れたような答えを探しています。 「ああ、そうですね、最小限の乗算を使用しながら、このようなエッジケースを解決するので、タップされた状態のラティス形式で、ある程度の論文のパラメーター化III-2bを使用したいと思います。」 おそらくそのようなものは存在しませんが、私の質問は、それが存在するかどうか、もしそうなら、それは何ですか、どこで見つけることができますか? ジャックポット ジェイソンRの答えのcomp.dspスレッドでティムウェスコットによって与えられた「観測者の標準形式」への参照に基づいて、私は制御システムの文献を掘り始めなければならないかもしれないと仮定することにしました。butterworth "state space"であり、パラメトリックバターワースだけでなく、チェビシェフフィルターと楕円フィルターも含めて、次の非常にクールな設計/実装の扱いを示しました。 Sophocles J. Orfanidis、「高次デジタルパラメトリックイコライザーデザイン」、J。Audio Eng。Soc。、vol。53、pp。1026-1046、2005年11月。 ペーパー:http : //www.ece.rutgers.edu/~orfanidi/ece348/hpeq.pdf Matlab Toolbox:http : //eceweb1.rutgers.edu/~orfanidi/hpeq/ 掘り下げるには少し時間がかかりますが、これまで読んだ内容に基づいて、探しているものではない場合は非常に驚くでしょう。Orfanidis論文に導いたcomp.dsp参照のために、これをJason Rに渡します。彼の答えは、バターワースフィルターの設計に関する実用的な概要でもあります。

2
この特定のシフト/スケール不変テンプレートマッチングに最適な画像処理技術は何ですか?
ここで最初に説明した問題は進化しており、さらに詳しく調べて新しい情報を得たため、少し簡単になったかもしれません。 結論として、コンピュータービジョン/画像処理技術を使用して、ここに示されているこのパターンを検出できるようにしたいと思います。ご覧のとおり、理想的なパターンは4つの「ping」で構成されています。オブジェクト認識は次のようになります。 不変シフト 水平方向では、画像は周期的になります。(つまり、右に押す、左に出る、およびその逆)。 (幸いなことに)垂直的には、周期的ではありません。(つまり、上または下に押すと停止します)。 スケール不変(表示されるように、pingの「厚さ」は異なる場合があります。) 私はそれについて続けることができますが、私が意味することをカバーする画像を添付しています、以下をご覧ください: もちろん、このファミリーからわかるように、それらは異なる「スケール」でもあります。 そして最後に、実際に受信する可能性のある「現実的な」シナリオをいくつか示します。ノイズがあり、行が下に行くにつれて「フェード」する可能性があり、もちろん、画像にはたくさんの偽の線、アーチファクトがありますなど そしてもちろん、グランドフィナーレとして、この「極端な」シナリオの明確な可能性があります。 そこで、もう一度、最高の検出のためにここでどのコンピューターマシンビジョンテクニックを利用すべきかについてのガイダンスをお願いしたいと思います。パターンの発生ます。また、現実的なシナリオで適切な結果を得ることができます。(良いニュースは、回転不変である必要はないということです)。これまでに思いついたのは、2次元相関だけです。 現実には、色付きの画像がないことを付け加えます-数字の大群を取得するだけなので、「グレースケール」について話していると思います。 前もって感謝します! PSその価値のために、おそらくオープンC Vを使用します。 編集#1: コメントに基づいて、あなたがリクエストした詳細をここに追加しました: データを定義する特性については、次のことを想定できます。 各pingの水平方向の長さはさまざまですが、上限と下限はわかっています。この範囲内のすべての場合はYES、外部の場合はNO。(たとえば、pingの長さは1〜3秒の範囲であることがわかっています)。 すべてのpingは、YESの場合は「可視」である必要がありますが、最後の行が欠落している可能性があり、それでも「YES」と言いたい場合があります。そうでなければNO。 各pingの垂直方向の長さ(「厚さ」)は異なる場合がありますが、ここでも上限と下限を知っています。(これらの画像に表示されるものと同様)。その範囲内のすべてに対してはい。外のものは一切ありません。 YESの場合、各ping間の高さは常に同じである必要があります。そうでない場合、NO。(例、すべてのpingが互いに相対的に同じ高さであることがわかります(垂直軸で〜110))。したがって、110 +/- 5はYESになりますが、それ以外はNOでなければなりません。 私はそれについてだと思います-しかし、私が追加できるものを教えてください...(また、ここに示されているものはすべて、YESとして登録する必要があります)

6
パラメトリックカーブに極と零点を分布させることによるフィルター設計
AN NNN番目の順バターワースローパスフィルタのカットオフ周波数ωcωc\omega_c分配することにより設計することができるNNNパラメータに対して均一極を0&lt;α&lt;10&lt;α&lt;10 < \alpha <1 s平面パラメトリック曲線上のf(α)=ωcei(π/2+πα)f(α)=ωcei(π/2+πα)f(\alpha) = \omega_c e^{i(\pi/2+\pi\alpha)}、半円形です。 図1. 6次バターワースフィルターの極(CC BY-SA 3.0 Fcorthay) 同じパラメトリック曲線を、正規化されていない伝達関数を与える任意のフィルター次数使用できることは注目に値しNNNます。 H(s)=∏k=1N1s−f(2k−12N),(1)(1)H(s)=∏k=1N1s−f(2k−12N),H(s)=\prod_{k=1}^N\frac{1}{s-f\left(\frac{2k-1}{2N}\right)},\tag{1} そして、結果のフィルターは常にバターワースフィルターであること。つまり、同じ数の極と零点をもつ他のフィルターは、周波数ω=0ω=0\omega = 0およびでの振幅応答の消失導関数の数が多くなりませんω=∞ω=∞\omega = \infty。同一のカットオフ周波数有するバターワースフィルタの組ωcωc\omega_cバタワースのサブセットを形成するには、パラメトリック曲線たフィルタf(α)f(α)f(\alpha)固有のものです。NNNには上限がないため、サブセットは無限です。 より一般的には、パラメトリックカーブに由来する場合を除き、極と零点を無限に数えない、NNpNNpNN_p極とNNzNNzNN_z零点、NNNは整数、Nz/NpNz/NpN_z/N_pは整数の非負の分数を持つフィルターは、正規化されていない形式の伝達関数: H(s)=∏NNzk=1(s−fz(2k−12NNz))∏NNpk=1(s−fp(2k−12NNp)),(2)(2)H(s)=∏k=1NNz(s−fz(2k−12NNz))∏k=1NNp(s−fp(2k−12NNp)),H(s)=\frac{\prod_{k=1}^{NN_z}\left(s-f_z\left(\frac{2k-1}{2NN_z}\right)\right)}{\prod_{k=1}^{NN_p}\left(s-f_p\left(\frac{2k-1}{2NN_p}\right)\right)},\tag{2} ここで、fp(α)fp(α)f_p(\alpha)およびfz(α)fz(α)f_z(\alpha)は、極限における極と零点の分布を記述するパラメトリックカーブですN→∞N→∞N\to\infty。 質問1:バターワース以外のフィルタータイプには、いくつかの最適性基準で定義され、式ごとに分数Nz/NpNz/NpN_z/N_pとパラメトリック曲線fp(α)fp(α)f_p(\alpha)およびのペアでそれぞれ定義される無限のサブセットがありますfz(α)fz(α)f_z(\alpha)。2、フィルターはだけ異なるNNN?タイプI チェビシェフフィルター、はい; これらの場合、極はパラメトリック角楕円の半分に存在しαα\alphaます。バターワースとタイプIおよびタイプIIのチェビシェフフィルターはどちらも楕円フィルターの特殊なケースです。。明確にするために、「無限のサブセット」とは、無限の数のサブセットではなく、無限のサイズのサブセットを意味します。 質問2:非バターワース非チェビシェフ楕円フィルターには、このような無限のサブセットがありますか? 質問3:すべての楕円フィルターはそのような無限のサブセットにありますか? すべての楕円フィルターの無限集合が、極を配置するための単一のパラメトリックカーブとゼロを配置するための単一のパラメトリックカーブ、および零点から極への場合、楕円フィルターを得るための数値最適化は、特定の次数のフィルターではなく、パラメトリック曲線を最適化することで実行できます。最適な曲線を複数のフィルター次数に再利用して、最適性を維持できます。上記の「if」が質問2と3を尋ねる理由です。質問1は、他の最適性基準へのアプローチの拡張に関するものです。 確かに、楕円フィルターの極-零点プロットは、基本的な曲線があるように見えます。 図2. s平面上の楕円ローパスフィルターの対数振幅。白い点は極であり、黒い点はゼロです。 1つのリードは、Eqごとです。1、特定の値、したがって特定の極とゼロの位置を複数のフィルター間で共有する必要があります。αα\alpha 図5. 異なるフィルター次数Nに対して曲線パラメーターによって取得された値。いくつかのフィルター次数に対して、たとえばα = 0.5またはα = 0.25およびα = 0.75があることに注意してください。αα\alphaNNNα=0.5α=0.5\alpha = 0.5α=0.25α=0.25\alpha = 0.25α=0.75.α=0.75.\alpha = 0.75. 具体的には、持っているフィルタのため極または零点を、それらがすべて持っているフィルタでも現れる3 N …

2
静止信号と非静止信号
教科書やウィキペディアには素晴らしい技術的な定義がありますが、実際に定常信号と非定常信号を区別するものを理解するのに苦労していますか? 次の離散信号のうち、静止しているのはどれですか?なぜ?: ホワイトノイズ- はい(見つかったすべての情報による) 有色ノイズ- はい( 有色ノイズによる:定常または非定常?) チャープ(周波数の変化に伴う正弦波)-? 副鼻腔-? 周期と振幅が異なる複数の副鼻腔の合計-? ECG、EEG、PPTなど-- カオスシステムの出力(mackey-glass、ロジスティックマップ)-? 屋外温度の記録-? 外国為替市場の通貨ペアの開発の記録-? ありがとうございました。

3
解析中(DFT)ではなく、合成中(IDFT)に大きさが正規化されるのはなぜですか?
私が見たほとんどの例とFFTコードでは、順方向DFT操作の出力(周波数の大きさ)はNでスケーリングされます-つまり、各周波数ビンの大きさを与える代わりに、N倍の大きさを与えます。 運用上、これは単純に、各基底正弦と信号の内積をとることによってDFTが計算されるためです(つまり、非正規化相関)。しかし、それはなぜ出力を返す前に単にNで割らないのかという哲学的な質問には答えませんか? 代わりに、ほとんどのアルゴリズムは再合成時にNで除算します。 これは私には直観に反しているように思われ、(私が何かを見逃していない限り)DFTのすべての説明を非常に混乱させます。 私が思いつくすべてのシナリオで、実際の大きさ(大きさ* Nではなく)はDFT操作に必要な値であり、正規化された大きさはIDFT操作に入力する値です。 なぜDFTはDFT / Nとして定義されておらず、IDFTは正規化された大きさの正弦波の単純な合計として定義されていないのですか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.