整数パラメーターの最尤推定値を見つける方法は?


7

ハードウェアの質問

x1,x2,,xnは、平均および分散持つ独立したガウス変数です。定義不明です。からを推定することに関心があります。μσ2y=n=1NxnNNy

a。与えられた がそのバイアスと分散を決定します。N^1=y/μ

b。与えられたがそのバイアスと分散を決定します。N^2=y2/σ2

が整数であることの要件を無視するN

c。効率的な推定器はありますか(と両方を見てください)?μ=0μ0

d。から最尤推定値をます。Ny

e。から CRLBを求めます。Ny

f。推定量の平均二乗誤差は、ときにCRLBに達しますか?N^1,N^2N

ここに画像の説明を入力してください

誰かが私を次の問題の解決に導くことができればそれは素晴らしいでしょう。

おかげで、

ナダブ


の分布とは何ですかY=iXi?
BruceET

それは言いません。ガウス変数の合計であるため、ガウス変数としても配布されると思います
Nadav Talmon

1
が正常であれば、とは正常です。平均と分散とは何ですか これで問題は解決します。//実際には、を整数に丸めることが理にかなっていると思います。これにより、平均と分散にわずかな違いが生じる可能性があります。シミュレーションでどれだけの違いがわかるか。XiY=IXiN^=Y/μN^?N^
BruceET

ないであろう?平均に対して同じ論理Var(Nestimated)Var(y)/μ
Nadav Talmon

2
は整数であるため、(直接)微積分を使用して最小値を見つけることはできません。これがあなたの障害である場合、あなたの質問にあなたの仕事を提示してください。そうすれば、あなたが実際に助けを必要とする場所に焦点を当てることができます。N
whuber

回答:


11

可能性の表現を書き留めることから始めました。 ことを認識することが単純であるの合計であるの独立したノーマル変数、平均して正規分布持っと分散をその可能性があるそこY,N(μ,σ2)NμNσ2,

L(y,N)=12πNσ2exp((yNμ)22Nσ2).

負の対数してみましょうその最小値は尤度の最大値に対応します。Λ=logL,

2Λ(N)=log(2π)+log(σ2)+log(N)+(yNμ)2Nσ2.

この式を最小化するすべての整数を見つける必要があります。が任意の正の実数である可能性があることを 少しの間見せます。このように、の連続微分可能関数である誘導体とはN2ΛN

ddN2Λ(N)=1N(yNμ)2σ2N22μ(yNμ)Nσ2.

これをゼロに等しくして臨界点を探し、分母をクリアし、少し代数を実行して結果を単純化します。

(1)μ2N2+σ2Ny2=0

一意の正の解を使用して()μ0

N^=12μ2(σ2+σ4+4μ2y2).

が近づくか大きくなると、が大きくなることを確認するのは簡単です。したがって、近くにも近くにもグローバル最小値がないことがわかり それは、私たちが見つけた唯一の重要なポイントを残します。したがって、それはグローバルな最小値でなければなりません。さらに、は、が下または上から近づくにつれて減少する必要があります。したがって、N02Λ(N)N0N.2ΛN^

のグローバル最小値は、両側の2つの整数の間にある必要がありますΛN^.

これにより、最尤推定量を見つけるための効果的な手順が得られます。これは、の床または天井(または場合によっては両方)なので、を計算し、これらの整数のどれを選択するだけで最小。N^N^2Λ

一時停止して、この結果が理にかなっていることを確認しましょう。 2つの状況で直感的な解決策があります。

  1. ときよりはるかに大きい、近くにあることを行っているのまともな見積もりどこから単にだろう そのような場合、無視してMLEを近似し、(期待どおり)μσYμ,N|Y/μ|.σ2,

    N^=12μ2(σ2+σ4+4μ2y2)12μ24μ2y2=|yμ|.

  2. ときよりもはるかに大きいあらゆる場所に普及することが、可能性があり、平均して近くにある必要がありの直感的な見積もりどこから単にだろう 実際、式でを無視すると、期待される解σμ, Y Y2σ2,Ny2/σ2.μ(1)

    N^y2σ2.

どちらの場合も、MLEは直感に一致しており、おそらく正しく機能したことを示しています。興味深い状況は、その後、ときに発生と同等のサイズです。ここでは直感はほとんど役に立ちません。μσ


これをさらに調査するために、私はがまたは である3つの状況をシミュレートしましたが何であっても(それがゼロでない限り)問題ではないため、 それぞれの状況で、の場合のランダムを生成し、これを独立して5000回繰り返しました。σ/μ1/3, 1,3.μμ=1.YN=2,4,8,16,

これらのヒストグラムは、のMLEを要約します。垂直線はの真の値を示します。NN

図

平均して、 MLEはほぼ正しいようです。とき比較的小さい、MLEは正確になる傾向がある。一番上の行の狭いヒストグラムを示すものだという。とき MLEはかなり不確実です。とき MLEはしばしば可能、時には数回することができ(特に小さいです)。これらの観察は、前述の直感的な分析で予測されたものと一致しています。σσ|μ|,σ|μ|,N^=1NN


シミュレーションの鍵は、MLEを実装することです。を 解くだけでなく、および特定の値についてを評価する必要があります ここで反映されている唯一の新しいアイデアは、 の両側の整数をチェックすることです関数の最後の2行は、対数尤度を評価する助けを借りて、この計算を実行します。(1)ΛY, μ,σ.N^.flambda

lambda <- Vectorize(function(y, N, mu, sigma) {
  (log(N) + (y-mu*N)^2 / (N * sigma^2))/2
}, "N") # The negative log likelihood (without additive constant terms)

f <- function(y, mu, sigma) {
  if (mu==0) {
    N.hat <- y^2 / sigma^2
  } else {
    N.hat <- (sqrt(sigma^4 + 4*mu^2*y^2) - sigma^2) / (2*mu^2)
  }
  N.hat <- c(floor(N.hat), ceiling(N.hat))
  q <- lambda(y, N.hat, mu, sigma)
  N.hat[which.min(q)]
} # The ML estimator

1
私はもっ​​と良い説明を求めることはできなかったでしょう。本当にありがとうございました。文字通りすべてをカバーしました!
Nadav Talmon

次に、効率的な推定量が存在するかどうかを確認する必要があります(および)。推定者が公平であり、その効率よりもCRLBに答える場合、私は知っています。私はその偏りがないことを知っていますが、L関数の2次導関数を取るとどこにも行きません。μ!=0μ=0
Nadav Talmon

が整数であるという事実は無視してください。つまり、推定値が負の対数尤度関数のグローバル最小値になるようにします。そこから進んでください。N
whuber

あなたが提案し、以下の式を取得しようとしましたように私は、負の対数尤度関数の導関数を取った:私が行うために管理し、その上ではなく、上のこれが、独自の正の解があった理由 です。C(N)×(g(y)N)μ=0μ!=0μ!=0
Nadav Talmon

私はそうは思いません。対数尤度の導関数は 2次関数であるため、問題を再パラメーター化する方が簡単だと思いますθ=1/N,θ.
whuber

5

whuberが彼の優れた答えで使用した方法は、尤度関数を拡張して実際の値を許可し、次に対数尤度の凹面を使用して離散最大化値が連続最適値の両側の離散値。これは、凹状の対数尤度関数を含む離散MLE問題で一般的に使用される方法の1つです。その値は、通常、連続最適化のための単純な閉形式の式を取得できるという事実にあります。N

完全を期すために、この回答では、前方差分演算子を使用して離散計算を使用する別の方法を示します。この問題の対数尤度関数は、離散関数です。

y(N)=12[ln(2π)+ln(σ2)+ln(N)+(yNμ)2Nσ2]for NN.

対数尤度の最初の前方差は次のとおりです。

Δy(N)=12[ln(N+1)ln(N)+(yNμμ)2(N+1)σ2(yNμ)2Nσ2]=12[ln(N+1N)+N(yNμμ)2(N+1)(yNμ)2N(N+1)σ2]=12[ln(N+1N)+[N(yNμ)22N(yNμ)μ+Nμ2][N(yNμ)2+(yNμ)2]N(N+1)σ2]=12[ln(N+1N)(y+Nμ)(yNμ)Nμ2N(N+1)σ2].

代数を少し使用すると、2番目の前方差分は次のようになります。

Δ2y(N)=12[ln(N+2N)+2N(N+1)μ2+2(y+Nμ)(yNμ)N(N+1)(N+2)σ2]<0.

これは、対数尤度関数が凹型であることを示しているため、その最小化最大点は次のようになります。N^

N^=min{NN|Δy(N)0}=min{NN|ln(N+1N)(y+Nμ)(yNμ)Nμ2N(N+1)σ2}.

(次の値は、場合に限り、最大化ポイントになり。)MLE(最小セットまたはセット全体)は、単純な関数を介して関数としてプログラムできます。ループし、これはあなたにかなり迅速に解決策を与えることができるはずです。プログラミングの部分は演習のままにしておきます。Δy(N^)=0while


お時間とご説明をよろしくお願いいたします。@ベンありがとうございます!
Nadav Talmon

1

コメント: Rでの簡単なシミュレーションは次のとおりです これは、平均とSDを近似する2または3桁の精度ある必要がありますとを見つけることができるはずです 以前のコメントで示したように、基本的な分析メソッド。私たちが持っていた場合は、その後のために公平なようであるμ=50,σ=3,Y.E(Y)Var(Y)N=100E(N^)N.

N = 100;  mu = 50;  sg = 3
y = replicate( 10^6, sum(rnorm(N, mu, sg))/mu )
mean(y);  sd(y)
[1] 99.99997
[1] 0.6001208
N.est = round(y);  mean(N.est);  sd(N.est)
[1] 99.9998
[1] 0.6649131

ブルース、ありがとう!
Nadav Talmon

もう一つ質問してもいいですか。ここで、私が見つけたものに関して効率的な推定量があるかどうか尋ねられます。また、Nが整数であることの要件を無視することも述べています。それがもはや整数ではないということはどういう意味ですか?このような場合のログの可能性はどのようにして見つけますか?
Nadav Talmon

1
バイアスの可能性を理解したい場合は、大きな使用しないでください。小さな値を試してください。 は特に興味深いです:-)。つまり、場合N:N=1μ=0.
whuber
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.