画像データのゼロ平均と単位分散とは何ですか?


7

ディープラーニングは初めてです。いくつかの概念を理解しようとしています。「平均」は平均値であり、「分散」は平均からの偏差です。いくつかの研究論文を読んだことがありますが、いずれも最初にデータを前処理すると言っています。しかし、これらの概念は画像の前処理とどのように関連していますか?これらの概念が画像データの前処理として使用されるのはなぜですか?
実際、これらの手法が分類にどのように寄与するかを理解できません。Googleで検索しましたが、説明が少ないキーワードで検索されている可能性があります


1
実際の分散は、平均との差の二乗の平均です。前処理ステップとして「標準化」または「再スケーリング」について質問していますか?数値の範囲が広いため、単一の説明変数が他の変数を支配しないように設計されています。
ヘンリー

これは通常、画像の正規化と呼ばれ、その理由はリンクで確認できます。
Alex R.

1
ウィキペディアの特徴ベクトルを正規化する理由の優れた答え:「生データの値の範囲は大きく異なるため、一部の機械学習アルゴリズムでは、正規化を行わないと目的関数が正しく機能しません。たとえば、分類子の大部分はユークリッド距離による2つのポイント。いずれかのフィーチャの値の範囲が広い場合、距離はこの特定のフィーチャによって制御されます。したがって、すべてのフィーチャの範囲は、各フィーチャが最終的なdにほぼ比例して寄与するように正規化する必要があります。 。 "
アンナヴォプレタ

そのコメントは、0の平均単位分散の再スケーリングが画像にどのように関連しているかについて詳しく述べれば、より強力になります。
Sycoraxは、

@Sycorax画像は、モデルに供給される通常の特徴ベクトルとして扱われます。画像について特別なことは何もありません。正規化に関するすべての記述は、画像やその他の特徴ベクトルにも同様に適用されます。
アンナボプレタ

回答:


4

これは非常に良い質問であり、ディープラーニングについて理解を深めるには、これを理解する必要があります。

基本的に、あなたは生の画像を持っています、1枚の画像を撮りましょう。この画像には3つのチャネルがあり、各チャネルのピクセル値の範囲は0〜255です。

ここでの目標は、3つのチャネルのすべてのピクセルの値の範囲を非常に小さな範囲に縮小することです。これが前処理の出番です。しかし、前処理には平均と標準の技術しか含まれていないと考えてはいけません。PCA、ホワイトニングなど、他にもたくさんあります。

1)平均の使用:平均を計算することにより、すべてのトレーニング画像にわたる最初の赤いピクセル値は、最初の位置にあるすべてのトレーニング画像にわたって存在する平均赤い色値を取得します。同様に、すべての赤のチャネル値、緑のチャネル値についてこれを見つけます。最後に、すべてのトレーニング画像から平均画像を取得します。

すべてのトレーニング画像からこの平均画像を差し引くと、画像のピクセル値が明らかに変換され、画像は人間の目では解釈できなくなります。ピクサル値は、平均がゼロにある正から負の範囲にあります。 。

2)次に、これらをstd偏差で除算すると、基本的にピクセル値の範囲を小さい範囲に縮小します。

しかし、なぜこれがすべてなのか?私の経験から、この前処理を画像で実行してから、これらの変換された画像を分類子モデルに与えると、実行速度が速くなり、より良くなると言います。それが理由です。

ディープラーニングに興味があるときは、この正規化の概念を理解した後、バッチ正規化を調べてください。


5
バッチ正規化は、ディストリビューションの内部シフトに関連しており、私たちが話していることとは関係ありません。
HelloWorld

1
「私の経験から、モデルはより速く、よりよく実行されます」と、その説得力はありません。
アンナヴォプレタ
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.