フーリエ変換が画像処理/コンピュータービジョンでどのように、そしてなぜ使用されるかを理解しようとしています。以下は私がこれまでに集めたものです。それに対する私の理解は正しいでしょうか?そうでない場合は、誰かに簡単でわかりやすい英語で説明してもらえますか?または、誰か追加するものはありますか?最後に重要なことですが、誰かが「離散フーリエ変換」を説明できますか?
フーリエ変換は、画像をその正弦成分と余弦成分に分解します。簡単に言えば、サインとコサインはそれぞれ最小値と最大値で始まる波です。現実の世界では、観測する波が最大点と最小点のどちらから始まったのかわからないため、実際にはその2つを区別することはできません。したがって、サインとコサインは単に正弦波と呼ばれます。
FTを画像に適用するとき、それを空間ドメインから「周波数ドメイン」に変換します。これは、本質的に、時間の経過に伴う色と明るさの変化(時間ではなく空間です。ピクセル数を超えています)。
編集:なぜフーリエ変換を使用するのですか?そして、他の方法に比べてその利点は何ですか?たとえば、文学における1つのアプリケーションは、形状認識またはノイズ除去です。基本的に、FTを使用して形状認識を行うにはどうすればよいでしょうか。