@Alexey Grigorevはすでに非常に良い答えを出していますが、次の2つを追加すると役立つと思います。
- マニホールドの重要性を直感的に理解するのに役立つ例を提供したいと思います。
- その点について、「ユークリッド空間に似ている」ことを少し明確にしたいと思います。
直感的な例
(白黒)HDready画像(1280 * 720ピクセル)のコレクションで作業するとします。これらの写真は921,600次元の世界に住んでいます。すべての画像は、ピクセルの個々の値によって定義されます。
ここで、256面のサイコロを転がして各ピクセルを順番に塗りつぶして、これらの画像を作成するとします。
結果の画像は、おそらく次のようになります。
あまり面白くありませんが、保持したい何かにぶつかるまでそれを続けることができます。非常に疲れますが、Pythonの数行でこれを自動化できます。
意味のある(現実的なものは言うまでもなく)画像の空間が、特徴空間全体と同じくらい離れた場所にさえあるとしたら、すぐに興味深いものが見られます。多分私たちはあなたの赤ちゃんの写真や別のタイムラインからのニュース記事を見るでしょう。ねえ、どうやって時間コンポーネントを追加すれば、ラッキーになって、別のエンディングでBack to th Futureを生成することもできます
実際、以前はこれを正確に行うマシンを使用していました。正しく調整されていない古いテレビです。今、私はそれらを見たのを覚えており、構造さえ持っていたものを見たことがない。
なぜこれが起こるのですか?まあ:私たちが興味深いと思う画像は、実際には現象の高解像度の投影であり、はるかに高次元ではないものによって支配されています。たとえば、この場合、1次元の現象に近いシーンの明るさがほぼ100万次元を占めます。
これは、この場合(定義ごとではなく)サブスペース(多様体)があり、非表示の変数によって制御されており、対象のインスタンスが含まれていることを意味します
ユークリッド地方の行動
ユークリッド動作とは、動作に幾何学的な特性があることを意味します。非常に明白な明るさの場合:「それの軸」に沿ってそれを増やすと、結果の画像は連続的に明るくなります。
しかし、ここが興味深いところです。そのユークリッド動作は、マニホールド空間のより抽象的な次元でも機能します。Goodfellow、Bengio、Courvilleによるディープラーニングからこの例を検討してください
左:フレイ面多様体の2次元マップ。発見された1つの次元(水平)は主に顔の回転に対応し、もう1つの次元(垂直)は感情的な表現に対応します。右:MNISTマニホールドの2次元マップ
画像を含むアプリケーションでディープラーニングが非常に成功する理由の1つは、非常に効率的な形式の多様体学習が組み込まれているためです。これが、画像認識、圧縮、および画像操作に適用できる理由の1つです。