一般的に、関数を最大化します
ここで、は、基礎となる分布が連続的な場合の確率密度関数であり、分布が離散的である場合は、確率質量関数(積の代わりに合計を使用)です。
基になる分布が連続分布と離散分布の混合であり、それぞれの重みが依存している場合、尤度関数をどのように指定しますか?
一般的に、関数を最大化します
ここで、は、基礎となる分布が連続的な場合の確率密度関数であり、分布が離散的である場合は、確率質量関数(積の代わりに合計を使用)です。
基になる分布が連続分布と離散分布の混合であり、それぞれの重みが依存している場合、尤度関数をどのように指定しますか?
回答:
尤度関数観測値のデータの密度であるxの関数として表さθ ℓ (θ | X)= F (X | θ ) この密度は、毎(許容される)値のために定義されていますθに依存しないX上の特定の測度に対するx、Xのサポート上のほぼすべての場所でのθ。パラメトリックファミリーの場合、すべてのθにわたってこのような支配的な測定が存在する
尤度関数に関するウィキペディアエントリからの関連する抜粋を以下に示します(ストレスは私のものです)。
測度理論確率理論では、密度関数は、支配的な測度に対する確率分布のラドンニコディム微分として定義されます。これにより、離散、絶対連続、混合など、あらゆる分布の確率モデルに尤度関数が提供されます。 (尤度は、たとえば、パラメーター推定の場合、同じ支配的尺度に関してラドンニコディムの導関数である場合にのみ比較可能です。)
私のキャリアのかなり早い時期に、この質問に戸惑っていることを認めます。私が答えを確信した1つの方法は、状況について非常に実用的で応用的な見方をすることでした。 それがどこにつながるか見てみましょう。
この演習のポイントは、可能性の表現における密度と確率のやや派手な混合を正当化するために必要となる可能性がある仮定を明らかにすることです。したがって、それらが導入されている場合は常に、そのような仮定を強調します。かなりの数が必要であることがわかりましたが、それらはかなり穏やかで、私が遭遇したすべてのアプリケーションをカバーしています(明らかに制限されますが、まだかなりの数が含まれています)。
問題が懸念混合分布どちらも絶対連続でも特異であるものを。 ルベーグの分解定理は、そのような分布を絶対的に連続な分布(定義により密度関数)と確率質量関数を持つ特異な(「離散」)分布の混合として見ることを可能にします。 (私は3番目の、連続的であるが絶対的に連続的ではないコンポーネントが存在する可能性を無視します。そのようなモデルを使用する人は、彼らが何をしているかを知っている傾向があり、通常それらを正当化するためのすべての技術スキルを持っています。
とき分布のパラメトリックファミリーのメンバーであるが、我々は書くことができ
(もちろん、合計は最大でも数えられます。)ここで、は、いくつかの混合係数とを乗じた確率質量関数である
レッツは、任意の観測の解釈 IIDデータセット内の、我々は一定の知識を持って「本当に」という意味としてその仮想の真の根底にある値区間にある周囲それ以外についての情報がない すべてのデルタとイプシロンを知っていると仮定すると、確率ですべてを表すことができるため、尤度を構築する際に問題が発生することはありません。
サポート場合いずれにおいても結露ポイントがない確率への寄与はほとんどが単一用語はイプシロンを提供し、デルタが十分に小さくされている時に削減されます:何の貢献もないだろうときではありませんそのサポート。
我々は仮定した場合で連続リプシッツすべてのデータ値で、次いで均一イプシロン及びデルタのサイズで我々は絶対連続一部近似できるとして
この近似の均一性は、すべてのイプシロンとデルタを小さくすると、すべての項も小さくなることを意味します。その結果、これらのすべての誤差項の寄与によって支配される、非常に小さい値があります。
これはまだ少し厄介ですが、どこに行くのかを示しています。打ち切りデータの場合、これらのモデルは通常、分布の特異部分のサポートが連続部分のサポートから切り離されていると仮定するため、製品の各項の一部だけが非ゼロになります。パラメータはあるかもしれません。(具体的には、F a(x + ϵ )− F a(x − ϵ )= o (ϵ )を意味します)これにより、製品を2つの部分に分割することができ、連続部分からのすべての間隔からの寄与を因数分解できます。
(私はそのようにデータ索引付けた一般性を失うことなく、連続部分に寄与し、そうでなければに寄与します尤度の特異部分)
この表現により、
間隔幅があるので固定されている、彼らは(いくつかの正の定数倍にまでしか定義されている)可能性には寄与しません。
したがって、次の式を使用できます
尤度比を構築するとき、または尤度を最大にするとき。この結果のすばらしいところは、この導出で使用される有限区間のサイズを知る必要がないことです。イプシロンとデルタはすぐに削除されます。実際に使用する尤度式が間隔サイズを知っている場合に使用する尤度式の適切な近似になるように、それらを十分に小さくできることを知る必要があります。
この質問は、尤度分析において非常に重要な根本的な問題であり、非常に微妙で難しい問題でもあるので、コメントで受け取っている表面的な答えのいくつかにかなり驚いています。
いずれにせよ、この回答では、whuberの優れた回答(この問題に対する正しいアプローチだと思います)に1点だけ追加します。その点は、このコンテキストの尤度関数は混合優勢測度の密度関数に由来することであり、これにより、連続部分と離散部分で尤度関数の相対サイズを任意にスケーリングできるという興味深い特性が得られます。尤度関数。これにより、一意の尤度関数がない場合に、どのようにして尤度手法を実装できるかという明らかな疑問が生じます。
この点を説明するには、確率測度のラドンニコディム微分としてのサンプリング密度に関する予備的なプレゼンテーションが必要なので、ご容赦ください。最初に混合優勢メジャーの密度関数を取得する方法を示し、次にこれがなぜ可能性の連続部分と離散部分を自由にスケーリングできるようになるのかを示します。最後に、尤度ベースの分析に対するこの問題の影響について説明し、その解決策について私の意見を述べます。これは本質的に彼の答えにwhuberが提示する方法によって解決されると思いますが、個別の部分のサポートの各ポイントが無視することを確実にするために、その答えへのコメントで議論した方向に拡張する必要がありますその時点での連続部分。
支配的な尺度を使用して密度を発現する:実際のランダム変数の混合密度に対処する標準的なアプローチは、使用するルベーグ測度 連続部分とするための支配的な尺度として計数測度 (一部は可算集合指定かけ)個別部品の支配的な尺度として。これにより、次の式で定義されるラドンニコディム微分が導かれます。
これは、主要なメジャーのスケーリングプロパティが、標準のMLE問題では無視できるスケーリング定数を通じてのみ尤度関数に影響を与えることを示しています。この問題の私の扱いでは、この有用な特性は、サンプリング密度が離散部分をサポートしているときに連続密度を無視する方法で定義されているという事実の直接の結果として発生したことに注意してください。(これは、これらのパーツの組み合わせを許可するwhuberの回答とは異なります。これは実際にはいくつかの困難な問題につながる可能性があると思います。その回答に対する私のコメントを参照してください。)