機械学習で「前」という用語が意味するもの


12

機械学習は初めてです。私は、さまざまなアプリケーションにディープラーニングを採用し、ほとんどのモデル設計ケースで「前」という用語を使用したいくつかの論文を読みました。それが実際に何を意味するのか誰かが説明できますか?チュートリアルでは、事前と事後の数学的な定式化のみを見つけることができました。


5
それは数学的な概念なので、そうです、数学的に定式化されています。しかし、ウィキペディアのページは、多くの直感を与えているようです。確認しましたか?もしそうなら、あなたはあなたが理解しなかったこととあなたが答えで何を探しているのかについてもっと話してくれませんか?
David Richerby 2017年

@David Richerby。お返事ありがとうございます。はい、ウィキペディアのページを確認したところ、知識や変数に関する情報についての漠然とした考えを集めることができました。私は体の姿勢推定に関する論文を読んでいて、体の姿勢の事前、身体の運動学の事前、3Dの人間の姿勢に対する事前のモデル化、事前の学習、3Dの人間の姿勢を推定する前の言及がありました。この文脈で「前」という用語が実際に何を意味するのか、はっきりと理解できませんでした。
エイミー

回答:


13

簡単に言えば、数学記号なしで、事前と、確率分布の観点から、イベントに関する最初の信念を意味します。次に、実験を設定してデータを取得し、実験の結果(事後確率分布)に従って信念(および確率分布)を「更新」します。

例: 2枚のコインが与えられたとします。しかし、どのコインが偽物であるかはわかりません。コイン1は偏りがなく(HEADSとTAILSの確率は50%)、コイン2は偏っています。たとえば、HEADSの確率が60%であることがわかります。数学的に:

HEADSがある場合、コイン1である確率は0.4 あり、コイン2である確率は0.6 p H | C o i n 2= 0.6です。

pH|Co1=0.4
pH|Co2=0.6

つまり、実験を始める前に知っていることはこれだけです。

次に、それを投げてコインを選び、所有している情報(HまたはT)に基づいて、選択したコイン(コイン1またはコイン2)を推測します。

最初は、と仮定します。まだ情報がないため、両方のコインに等しい確率があります。これは私たちの以前のです。それは一様分布。pCo1=pCo2=0.5

pCo1|H=pH|Co1pCo1pH|Co1pCo1+pH|Co2pCo2=0.4×0.50.4×0.5+0.6×0.5=0.4

pCo2|H=pH|Co2pCo2pH|Co1pCo1+pH|Co2pCo2=0.6×0.50.4×0.5+0.6×0.5=0.6

0.5

これは、機械学習で使用されるベイズ推定と統計の基本原理です。


2
上記の例を修正する必要があります。その計算は、両方のコインがバイアスされていることを示しています(最初のコインはヘッド40%の確率、2番目のコインはヘッドの確率60%です)。 = 5/11およびP(Coin2 | H)=
6/11

なければならない「私たちは頭を持って考えると、それはコイン1である確率が0.4をされた」のように書き換えることが「私たちはコイン1持っていること、それがHEADSである確率が0.4で与えられましたか」
Mateen Ulhaq
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.