まず、私は謝罪します。私はソフトウェア開発者であり、純粋な数学に飛び込んでいないのは非常に長い期間なので、私の質問は馬鹿げているように見えるかもしれません。私は望みません。
コンテキストは、音楽のピッチ認識です。
音符を取り、それにフーリエ変換を適用すると、特定の周波数の振幅の合計が無限になります。たとえば、任意の楽器で基本がである音符を演奏すると、フーリエ変換後、F 、2 F 、3 F 、… 、n Fで高調波が発生します。すべての周波数には、楽器の音色を定義する特定の振幅があります(ピアノ、声、トランペットなどすべてはこの音に従いますが、すべての倍音に対して異なる振幅があります)。
今私がしたいのは、与えられたオーディオ信号からです、見つけます。それだけ。常にバックグラウンドノイズなどがあるため、見た目よりも複雑です。さらに、Fは必ずしも最大の振幅を持つ周波数である必要はありません。
したがって、を見つけるための私のアイデアは、DFT(実際には速度のFFT)を適用し、周波数Fを見つけることです。これにより、F + 2 F + 3 F + … + n FがFFT出力で最大になります。
それは可能だと思いますか?それは非常に短い時間で可能だと思いますか(<5ミリ秒としましょう)?