ランチョスのリサンプリングは空間コンテキストで何に役立ちますか?


46

GDALには、最近接、バイリニア、キュービック、およびスプラインの通常の組み合わせを超えるリサンプリング方法が含まれます:「Lanczos windowed sinc resampling」。私はその畳み込みフィルターであることを理解していますが、結果が主観的である傾向がある画像とは異なり、空間データに使用されるリサンプリングには他の意味があります。Lanczosとは何ですか?それを使用すると出力にどのような影響がありますか?


4
これは、stackoverflow.com / questions / 1854146 / ...の正確な複製であり、適切な回答があります。
whuber

回答:


72

ランチョスのリサンプリングとは何ですか?

理論は初期の論文ウィキペディアの記事で説明されていますが、リサンプリング方法の「感触」は、単純な画像または標準的な画像で計算することによって最もよく得られます。これは広大なトピックになる可能性があり、広範な実験が必要ですが、いくつかの簡略化が可能です。

  • これらの演算子は、各カラーチャネルで個別に機能します。したがって、単色(「白黒」)画像でどのように機能するかを調べるだけで十分です。

  • 画像処理で使用されるほとんどの畳み込み演算子は、x方向とy方向で同じように機能し、両方向で独立して機能します。実際には、これらは実際には最初に行に適用され、次に列に適用される1次元演算子です。つまり、詳細にプロットできる「1D」画像を調べることで、それらを調べることができます。

  • 線形演算子(すべての畳み込み演算子を含む)について知る必要があるすべてのことは、演算子がすべての最も単純で非定数のイメージでどのように機能するかから推測できます。これは、ある値から別の値への突然のジャンプです。

いくつかの一般的なリサンプリング方法の図を見てみましょう。実際には、2つの図が必要です。1つは新しい画像が古い画像より粗い「ダウンサンプリング」で何が起こるかを示すもので、もう1つは新しい画像が古い画像を改良した「アップサンプリング」を見るものです。詳細を示しているため、後者から始めましょう。

アップサンプリング

7〜80個のセルを画像としてリサンプリング

左側の元の7 x 7の画像は、各行が同じであるため、実際には1次元です。リサンプリングは列全体で行われます。他の5つの画像の寸法は80 x 80で、各メソッドが元の粗いピクセル間をどのように補間するかを詳細に示しています。最近傍サンプリングでは、暗い部分と明るい部分の間のシャープな分割が維持されますが、他の4つの方法では、介在領域がある程度ぼやけます。特に、Lanczosリサンプラーは、元の領域よりも暗い領域と元の領域よりも明るい領域を作成します。 (これは、そのようなので、GISの仕事に影響を持つことができ、外挿元の値を使用すると、新しい値が無効になる可能性があります。また、元のカラーマップの範囲を超えて拡大する可能性があり、リサンプリングイメージの極端な値が誤ってレンダリングされることがあります。これは、たとえばArcGISでのバイキュービックコンボリューションリサンプリングの問題です。)

(注:ここに示す「バイキュービック」法は、ArcGISの「バイキュービックコンボリューション」ではなく、バイキュービックスプラインです。)

明度を使用して画像値を描写することは、自然ですが、あまり正確ではありません。次の図は、列(水平軸)ごとにセル値(垂直軸)をグラフ化することでこれを修正しています。

プロットとしての7〜80個のセルのリサンプリング

グラフ上の低い値は、画像の暗い部分に対応します。元の思慮深い調査は隠された仮定を明らかにします:元の画像暗いから明るいへの鋭いジャンプのように見えますが、実際にはジャンプは列の範囲の7分の1(1/7)にわたって発生します。画像が描いている元のシーンで、その間隔で実際に何が起こるかを誰が言うのですか?したがって、この短い間隔内で発生するリサンプリング方法の違いについてあまり重要ではないはずです。それぞれが、元のシーンで発生する可能性のある、異なるが潜在的に同等に有効なレンダリングを提供します。この意味で、最近傍サンプリングが最も忠実な補間方法であることはもはや明らかではありません。

私たちが引き出さなければならない1つの結論は、どんなアップサンプリング方法の精度も下層のシーンの性質に依存するということです。シーンが1つのポイントから次のポイントまで滑らかに変化する値で構成されている場合、最近傍法は、示されている値の中で最も忠実なリサンプリング方法である可能性があります。

ダウンサンプリング

ダウンサンプリングされた画像

ここでは、16 x 16の画像を8 x 8の画像にダウンサンプリングした結果(2 x 2の集約)を確認できます。最近傍は、鋭い境界を正確に保持します。ランチョスは、見かけのシャープネスを強化することで他とは異なります。よく見ると、境界の片側の暗い領域が暗くなり、反対側の明るい領域が明るくなっていることがわかります。グラフはこれを明確にします:

ダウンサンプリングされた画像のグラフ

バイリニア、バイキュービック、およびガウスのリサンプラーは、すべての正の重み(または非常に小さい負の重み)を持つ畳み込み演算子の特性を示します。それらは、隣接する値を平均、または「スミア」します。ダウンサンプリングでは、これによりシャープなフィーチャがぼやけます。ぼかしの程度は、カーネルの幅によって異なります。これらと同様に、ランチョスリサンプラーもジャンプをぼかしますが、両側で「オーバーシュート」します。これは、画像自体のすぐ上に見られるコントラストの向上です。コントラスト(画像の高低の局所的な差)を増加させるこの傾向のため、ランチョスリサンプラーは「シャープニングフィルター」と呼ばれます。これらのグラフは、この特性評価には微妙な理解が必要であることを示しています明らかに、ジャンプの両側の値の平均化を実際には削減しないためです。ピクセル4では、その値0.56は他の畳み込みフィルターによって計算された値に匹敵します。

使用すると出力にどのような影響がありますか?

もっと複雑な画像で何が起こるか見てみましょう。

複雑な画像のリサンプル

元の13 x 13の画像には、可能な限り高い空間周波数のパターンが含まれています(右側の列ごとに明暗が交互になります)。ダウンサンプリング時にこのような機能を再現することはできません。ピクセルの量が少ないと、このすべての情報を保持できなくなります。そのような画像がアップサンプリングされたときに何が起こるかに焦点を当てましょう。シーンを忠実に再現する場合は、この高周波パターンを正確に再現する必要があります。

小さい画像は25 x 25ピクセルにリサンプリングされます。ほとんどではありませんが、2:1の精度です。私の目には、ランチョス法と双線形法は、4つの畳み込みリサンプラーの中でストライプを最も鮮明に再現します。最も近い隣人は、もちろん、最も忠実です(値をまったく平均化できないため)。

リサンプリングされた複雑な画像のグラフ

同じ結果のこれらのグラフは、ランチョスリサンプラーが、一定値のライト内に強度の変化を導入することを犠牲にして、ストライプのコントラスト(低域から高域への垂直スイングのサイズで見られる)を維持できることを示しています画像の中央の領域(元のピクセル5、6、7)。この変動は、画像の明るい部分(中央)内にストライプ状のアーチファクトとして現れます。ここに示されているリサンプラーのうち、このような誤った詳細を導入するのはそれだけです。

空間アプリケーションで何が役立ちますか?

明らかに、ランチョスのリサンプリングは、リサンプリングに対する万能薬やオムニバスのソリューションではありません。 ローカルコントラストの維持(または強化)において、他の多くの畳み込みリサンプラーよりも優れています。 これは、リサンプリングされた画像が詳細な特徴または境界の識別を表示することを目的としている場合に役立ちます。その後、リサンプリングされた画像が分析または処理されるとき、ランチョスのリサンプリングにより、エッジおよび線形特徴を検出する能力が向上する場合があります。

ただし、リサンプリングされた画像が他の方法で分析される場合、ランチョスのリサンプリングの利点は疑わしいです。通常、焦点範囲や焦点標準偏差など、空間的な変動性の局所的な測定値を(人工的に)増加させます。他の畳み込みリサンプラーのように、全体の空間平均には影響しませんが、通常は正規化されます(つまり、バイアスが導入されていないローカル加重平均です)が、一部のローカル平均を増加させ、他のリサンプラー。

ここでの(必然的に短い)評価は、一般的にランチョスリサンプラーをダウンサンプリングに使用すべきではないことを示唆しています:そのアプリケーションでは、より単純な(より一般的に利用可能な)メソッドには何も提供されていないように見えますデータ値の。

あとがき:一般的なコメント

ここで説明する調査は、GIS操作がどのように機能するかについて質問がある場合に誰でもできることの例です。GIS自体を調査の対象として使用します。操作または分析方法が何を行うかを知るには、制御された実験条件下でそれを適用するだけです。 この場合、単純なテスト画像を構築し、利用可能な方法に従ってそれらを再サンプリングし、結果を調べることになります。

GISがどのように機能するかを学習するには、このアプローチには3つの重要な側面があります。

  1. 理論。実験は通常「盲目的」に行うことはできません。何らかの理論を知るのに役立ちます。 通常、多くを知る必要はありませんが、基本は必要です。この場合、畳み込みの理論により、実験する必要のある画像の数と種類が大幅に削減されました。フーリエ解析などについて何も知る必要はありませんでした(間違えないでください、そのような知識は有益です。しかし、この種の専門的な知識がなくても私たちを止めることはできません)。
  2. 練習します。GIS自体を使用して実験を実行することで、実際に何が行われるかを確認できます。これにより、理論(ソフトウェア何をすべきかを教えてくれます)と実践(実際に何をする)の間の断絶が回避されます。
  3. 定量化。質問が視覚に関係しない限り、結果評価するために、マップ(またはこの場合は画像)を見るだけに頼るべきではありません。最良の情報を得るには、出力を定量化し(ここではグラフで行います)、多くの場合、統計的な方法で説明し、要約する必要があります。

3

画像プログラムのLanczosフィルターまたは類似のタイプのフィルターを知っている場合があります。これらのフィルターは「シャープニングフィルター」と呼ばれます。このフォーラムトピックの良い例:最初の画像は元のファイルを示しており、その横には、滑らかな補間法(バイキュービックダウンサンプリングなど)を使用した場合のグリッドサイズを縮小した後の様子が示されています。

http://peltarion.eu/img/comp/moire/D_lanczos3.jpg ただし、この画像にランチョスフィルターを適用するか、それをリサンプリングに使用すると、差異が増幅され、コントラストが局所的に増加したと言えます。 ここに画像の説明を入力してください

空間データの場合、これは非常に便利です:グリッド付きポリゴンマップを削減しようとしている場合や、エッジ検出に依存するアルゴリズムを実行する場合(スキャンされたポリゴンマップのデジタル化、画像のセグメンテーション())を想像してください。

一方、空間的な精度をいくらか失うことはありません。16x16マップは都市の大気汚染を表し、平均を使用するリサンプリングはそのグリッドセル内の平均大気汚染をより適切に表すと想像してください。


これらの画像はあなたが主張するものだとは思いません。右上は明らかにセル平均ではありません。その場合、左上の象限の縦縞はそこにありません。その画像の下にある画像(右下)を取得するために、何らかの形の「シャープニング」が適用されまし。これは誤ってエイリアスされています。これは機能の保持ではなく、アーティファクトの作成です。ランチョスフィルターを含む(ほぼ)すべてのフィルターは単位正規化されているため、平均に関する重要な点は、重み付けされていない近傍平均だけでなく、すべてのフィルターに適用されるため、区別する特性ではありません。
whuber

コメントを統合しました。しかし、セル内では、スムーズな内挿により、より良い予測が得られる可能性が最も高くなります
-johanvdw

-1

ウィキペディアから:

Lanczosリサンプリング(ハンガリー語の発音:[ˈlaːntsoʃ])は、サンプリングされたデータの新しい値を計算するために使用される内挿法です。多くの場合、画像のスケーリング(デジタル画像のサイズ変更)などの多変量補間で使用されますが、他のデジタル信号にも使用できます。Lanczosカーネルは、元のデータのどのサンプルを、どの割合で最終データの各サンプルを構成するかを示します。このフィルターは、以前は使用されていなかったさまざまな問題に対してフーリエ級数とチェビシェフ多項式を使用する方法を示したため、Cornelius Lanczosにちなんで命名されました。

アプリケーション:Lanczosフィルターは、sincフィルターのウィンドウ形式であり、理論的に最適な「ブリックウォール」ローパスフィルターです。sinc関数は範囲が無限であるため、実際には直接使用できません。代わりに、ウィンドウ関数で説明されているように、フィルターのウィンドウ形式と呼ばれる近似を使用します:フィルター設計、およびLanczosフィルターはそのようなウィンドウ処理の1つです。ウィンドウは範囲外で消え、より大きな範囲を使用すると、より多くの計算と引き換えに精度を向上させることができます。

評価:Lanczosフィルターは他のフィルター、特にsincフィルターの他のウィンドウと比較されました。一部の人は、切り捨てられたsincおよびBarlett、cosine、およびHann windowed sincと比較して、Lanczos(a = 2)が「エイリアシング、シャープネス、および最小リンギングの低減に関して最良の妥協点」であることに気付きました。

制限:カーネルはa> 1に対して負の値を想定しているため、非負の入力であっても出力値が負になる可能性があります。負の値は画像信号の範囲外であり、クリッピングアーティファクトを引き起こします。負のローブは、リンギングアーティファクトも引き起こします。

ただし、ウィンドウ処理により、アンダーシュートとリンギングの両方が(ウィンドウ処理されていない)sincフィルターに比べて減少します。特にa = 2の場合、正のサイドローブサイズが示すように、リンギングは特に小さくなります。


なぜ反対票ですか?この答えの何が問題になっていますか?元のリンクも提供しました。
チェサンS.

7
Wiki抽出がLanczosフィルターが空間データにどのような影響を与え、それが何に役立つのかという質問にどのように答えるかはわかりません。
暗闇

それは本当だ。私はランチョスと
チェサンS.

9
このウィキペディアの記事の大部分は、あまりにも曖昧すぎて役に立たない(他の人が以前に指摘したように)。答えは確かに最後の文にありますが、「アンダーシュート」と「リンギング」が何であるか(2Dで「ギブス振動」とも呼ばれる)を知り、「ポジティブサイドカーネル」とカーネルの形状とフーリエ変換への影響との関係を深く理解しています。要するに、わかりやすく有用であるためには、この答えにはある程度の増幅が必要です。
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.