ガウスフィルターが画像処理のローパスフィルターとして使用されるのはなぜですか？

30

1D信号処理では、多くのタイプのローパスフィルターが使用されます。ただし、ガウスフィルターはほとんど使用されません。

なぜ画像処理アプリケーションでそんなに人気があるのですか？これらのフィルターは、任意の基準を最適化した結果ですか、それとも単に画像の「帯域幅」が適切に定義されていないため、アドホックなソリューションです。

image-processing

— nimrodm
ソース

28

画像処理アプリケーションは、音声処理アプリケーションとは異なります。多くのアプリケーションは目のために調整されています。ガウスマスクは、光学的ぼけをほぼ完全にシミュレートします（点広がり関数も参照）。芸術的制作を目的とした画像処理アプリケーションでは、デフォルトでぼかしにガウスフィルターが使用されます。

ガウスフィルターのもう1つの重要な定量的特性は、どこでも非負であるということです。ほとんどの1D信号は0（）で変動し、正または負の値をとることができるため、これは重要です。画像は、画像のすべての値が非負（）であるという意味で異なります。ガウスカーネル（フィルター）との畳み込みにより、非負の結果が保証されるため、このような関数は非負の値を他の非負の値にマッピングします（）。したがって、結果は常に別の有効な画像になります。 $x \in \mathbb{R}$ $x \in \mathbb{R}^+$ $f: \mathbb{R}^+ \rightarrow \mathbb{R}^+$

一般に、画像処理における周波数除去は、1D信号ほど重要ではありません。たとえば、変調方式では、異なる搬送周波数で送信される他のチャネルを拒否するために、フィルタを非常に正確にする必要があります。私は、画像処理の問題を制約するものとは考えられません。

— フォノン
ソース

21

ガウスフィルターは、時間領域でのサポートが周波数領域でのサポートに等しいという特性があるため、画像処理で使用されます。これは、ガウスが独自のフーリエ変換であることに由来します。

これの意味は何ですか？フィルターのサポートがどちらのドメインでも同じである場合、両方のサポートの比率が1であることを意味します。結局のところ、これはガウスフィルターに「最小時間帯域幅積」があることを意味します。

それで、あなたは何を言うかもしれませんか？画像処理において、非常に重要なタスクの1つは、顕著なノイズを維持しながら、ホワイトノイズを除去することです。これは矛盾したタスクになる可能性があります-ホワイトノイズはすべての周波数に等しく存在し、エッジは高周波数範囲に存在します。（空間信号の突然の変化）。フィルタリングによる従来のノイズ除去では、信号はローパスフィルタリングされます。つまり、信号の高周波成分が完全に除去されます。

しかし、画像にエッジが高周波成分として含まれる場合、従来のLPF処理もそれらを削除し、視覚的には、エッジがより「汚れている」ように見えます。

それでは、ノイズを除去するだけでなく、高周波エッジを保持するにはどうすればよいですかガウスカーネルに入ります。ガウスのフーリエ変換もガウスであるため、ガウスフィルターは、それより高いすべての周波数が除去される通過帯域周波数で鋭いカットオフを持ちません。代わりに、優雅で自然な尾があり、周波数が高くなるにつれて低くなります。これは、ローパスフィルターとして機能することを意味しますが、テールの減衰の速さに見合った高周波数成分も許容します。（一方で、LPドメインは、Fドメインでのサポートがガウスのサポートほど大きくないため、時間帯域幅積が高くなります）。

これにより、ノイズ除去とエッジ保存の両方の長所を実現できます。

— スペイシー
ソース

2

1つは時間/長さで、もう1つはHz /ラジアンで測定されるため、2つのサポートを直接比較できるかどうかはわかりません。それらの形態は同一ですが、普遍的なスケーリング特性は依然として保持されます。

— フォノン

最小時間帯域幅積を思い出させてくれてありがとう。ただし、フォノンが述べたように、空間（〜時間）ドメインサポートを減らすと、必然的に帯域幅が増加します。単純なガウスフィルターでノイズ抑制とエッジの保持の両方を行うことはできません。それが、Perona＆Malikが異方性フィルタリングを開発した理由です。

— nimrodm

@Phonon私が見たように、サポートは単に、どちらのドメインの関数を記述するゼロ以外のエントリの数です-私はそれらが同じであると信じています。（したがって、1の比率）。つまり、時間帯域幅積は、時間と周波数の関数の分散の積として測定されます。正規化が著者とどのように異なるか、私はそれが1/2または1/4に等しいと見ました。

— スペイシー

1

@nimrodm「空間（〜時間）ドメインのサポートを減らすと、必然的に帯域幅が増加します。」、はい、それは時間と周波数の逆関係に起因する傾向です。（これは、時間と周波数の不確実性の原因です）。ただし、ガウス関数は、この積を完全に最小化するクラスです。時間と周波数の逆の関係を考えると、両方のドメインで同等のサポートがない限り、そうする方法はありません。

— スペイシー

@nimrodm異方性拡散では、画像の勾配に依存する共分散行列がありますが、私が見たカーネルはまだガウスです。（また、非線形法、VSガウス平滑化は線形です）。しかし、その特性のためにガウスは使用されたままです。

— スペイシー

11

すでに良い答えがありますが、2Dガウスフィルターのもう1つの有用なプロパティを追加します。つまり、それらは分離可能です。つまり、2Dフィルターは2つの1Dフィルターに分解できます。MxN分離可能フィルターはM+N乗算加算で実装できるのに対し、分離不可能なMxNフィルターはM*N乗算加算が必要なため、これはカーネルサイズが大きい場合に重要なパフォーマンスの考慮事項になります。

— ポール・R
ソース

2

それは良い議論です。2Dガウスフィルターは放射対称であり、分離可能であるため、実装の複雑さが大幅に軽減されます。

— nimrodm

1

参考として、DSPの科学者および技術者ガイドでは、第24章でこのプロパティの優れた説明を提供しています。

— カレブレイスター

6

imagemagickマニュアルには、sinc関数を使用したフィルタリングが「リンギング」効果をもたらすのに対し、ガウス分布はそうしない理由についての優れた説明があります。（http://www.imagemagick.org/Usage/fourier/#blurringおよびhttp://www.imagemagick.org/Usage/fourier/#circle_spectrum）。画像にエッジ（不連続性）がある場合（ほとんどの画像にあります）、すべての高周波を完全に切り取ると、空間領域に波紋が残ります。また、1次元でsinc関数を使用して方形波をフィルタリングすると、リンギングが発生します。

— さまよう論理
ソース

2

すでに美しい答えがありましたが、私は塩の粒を追加します。別の見方をします。

最も抽象的なレベルでのフィルタリングは、事前知識を生データに適用することと見なすことができます。つまり、何らかのフィルタリングアルゴリズムを適用することは、これを適用してから、たとえば最適なS / N比を見つけることです。

画像の場合、古典的な事前分布は、位置に対する値の滑らかさ（強度など）です（これは、@ Phononが言及する点広がり関数として見ることができます）。既知の滑らかさ半径を持つ異なるオブジェクトを混合するときに得られる形状であるため、多くの場合、ガウス型としてモデル化されます（これは中心極限定理と呼ばれます）。これは、画像の微分を作成する場合に最も役立ちます。生の信号（ノイズのある出力を生成する）で微分するのではなく、平滑化された画像で行う必要があります。これは、ガボールフィルターなどのウェーブレットのような演算子を適用するのと同じです。

— メドゥーズ
ソース