@beanによる短い回答は、それを非常によく説明しています。ただし、Resnik and Hardistyの初心者向けのGibbs Samplingのセクション1.1を指摘しておきます。このペーパーからほんのわずかな変更を加えて数行を書いています(この回答は、完全を期すためにOPが知っていることのいくつかを繰り返しています)。
MLE
形式的にMLEは、観測されたデータを生成する可能性が最も高い(モデルパラメーターの)選択を生成します。
地図
推定されたMAPは、観測されたデータから最も可能性の高い選択です。MLEとは対照的に、MAP推定ではベイズの規則が適用されるため、推定では、パラメーターが事前確率分布の形式であると予想されるものに関する事前知識を考慮に入れることができます。
キャッチ
MLEとMAPの推定値は、それぞれ「最良」の定義によると、どちらも最良の推定値を提供しています。ただし、単一の見積もりを使用すると(MLEでもMAPでも)、情報が破棄されることに注意してください。原則として、パラメーターは(ドメインからの)任意の値を持つことができます。パラメータの単一の推定値ではなく、分布全体を考慮に入れると、より良い推定が得られないのではないでしょうか。その場合、観測データXから取得できるパラメーターに関するすべての情報を利用します。
したがって、このキャッチでは、どれも使用したくない場合があります。あなたがあればまた、既に、豆とティムが言及する必要がありますが、以前得た場合、使用のMAPを、それらのいずれかを使用します。事前分布がない場合、MAPはMLEに減少します。共役事前分布は、問題を分析的に解決するのに役立ちます。そうでない場合は、ギブスサンプリングを使用します。