評価関数を最大化する確率分布を選択(CDCインフルエンザ予測コンテストの場合)


7

サポート確率質量関数を持つ離散確率変数があるとします。ような関数は、最大化し エッジケースの処理を回避するには、と仮定し。Xp(x)=P(X=x)0,,nq(x)0x=0nq(x)=1

E(log[q(X1)+q(X)+q(X+1)])?
P(X=0)=P(X=n)=0

関連する質問:

  • 上記の期待を最大化するは、が単調であるため、も最大化すると考えてい。あれは正しいですか?q(x)E[q(X1)+q(X)+q(X+1)]log
  • 勝るものはありますか?p(x)=q(x)

関心のある人にとって、この質問は、予測値を評価するための効用関数として、ターゲット値と近隣値の確率の合計のログを使用するCDCインフルエンザ予測コンテストから生じます。


リンクを提供していただけませんか?おそらく非常に明白な理由から、私は特に興味があります...
Cliff AB

2
溶液なぜ表示されないの溶液と同じでなければならないmaxqE[q(X1)+q(X)+q(X+1)]maxqE[log{q(X1)+q(X)+q(X+1)}]
Xi'an

ニュースリリースへのリンクを追加しました。残念ながら、実際の競技サイトへの記事内のリンクは現在ダウンしています。うまくいけば、すぐに戻ってくるでしょう。
jaradniemi

目的は、ピーク週などのターゲットのpmfを評価することですが、データ自体にノイズが多いため、ターゲットは不確かです。
jaradniemi

1
@jaradniemi:ああ、それは正確に区間打ち切りデータの問題であり、あなたの問題の解決策は区間打ち切りNPMLEです。
クリフAB

回答:


3

クールな問題!西安の導出が示すように、それはQからPへのKLの相違を最小化することに関連しています。クリフはいくつかの重要なコンテキストも提供します。

問題は最適化ソフトウェアを使用して簡単に解決できますが、一般的なソリューションの閉じた形式の数式を書く方法がわかりません。がバインドされない場合、直感的な式があります。qi0

ほぼ間違いなく最適な(最後にある私のグラフ例を参照してくださいが、近いかもしれません)。そして、はと同じ問題ではありません。はと同等の目的ではないことに注意してください。それは単調な変化ではありません。期待が合計であり、ログは行くの内側に、それは目的関数の単調変換ではありませんので、合計。qpmaxE[x]maxE[log(x)]x+ylog(x)+log(y)

ソリューションのKKT条件(つまり、必要かつ十分な条件):

および定義し。問題は次のとおりです: q0=0qn+1=0

maximize (over qi)i=1npilog(qi1+qi+qi+1)subject toqi0i=1nqi=1

ラグランジュ: これは、Slaterの条件が成立する凸最適化問題であるため、KKT条件が必要であり、最適化のための十分な条件です。1次条件:

L=ipilog(qi1+qi+qi+1)+iμiqiλ(iqi1)
pi1qi2+qi1+qi+piqi1+qi+qi+1+pi+1qi+qi+1+qi+2=λμi

相補的なたるみ: そしてもちろん。(私のテストではと思われますが、すぐにはわかりません。)とはラグランジュ乗数です。

μiqi=0
μi0λ=1μiλ

がバインドされない場合の解決策。qi0

次に、解決策を検討します

pi=qi1+qi+qi+13μi=0λ=1
一次条件に接続すると、。したがって、機能します(およびも満たされている限り)。13+13+13=1iqi=1qi0

行列の問題を記述する方法:

してみましょうとベクトルとします。してみましょうもののトライバンド対角行列とします。例えば。以下のためのpqAn=5

A=[1100011100011100011100011]

問題はより多くの行列表記で書くことができます:

maximize (over q)plog(Aq)subject toqi0iqi=1

これは数値的にすばやく解決できますが、きれいな閉じた形の解決策を見つける方法がありませんか?

解の特徴は次のとおりです: しかし、最適化ソフトウェアをチェックする以外に、それがどれほど役立つかはわかりません。

Ay=λux=Aqyi=pixi

CVXとMATLAB を使用してそれを解決するコード

A = eye(n) + diag(ones(n-1,1),1) + diag(ones(n-1,1),-1);

cvx_begin
 variable q(n)
 dual variable u;
 dual variable l;
 maximize(p'*log(A*q))

 subject to:
  u: q >= 0;
  l: sum(q) <= 1;
cvx_end

例えば。入力:

p = 0.0724    0.0383    0.0968    0.1040    0.1384    0.1657    0.0279    0.0856    0.2614    0.0095

解決策があります:

q = 0.0000    0.1929    0.0000    0.0341    0.3886    0.0000    0.0000    0.2865    0.0979    0.0000

解決策私は基本的に通常のPDF(赤)に従ってビンのトンを持っているときに(青)を取得します:ここに画像の説明を入力してください 別のより恣意的な問題: ここに画像の説明を入力してください

非常に大まかに言えば、場合、を取得しますが、が1トンあたりを移動する場合、最適化がの質量を質量の近傍に配置し、質量のあるの間に戦略的に配置します。pi1pipi+1qipipiqipipi

もう一つの概念のポイントは、あなたの見通しの不確実性が効果的にあなたの見積もり滑らかになるということである、スムーズな解決しています近いです。(そうだと思います)ppqp


私は条件を理解しておらず、ラグランジュ制約を含めることを省略していたでしょう。μi=0qi0
西安

@ Xi'an CVXを使用してこの問題を数値的に解決すると、制約が特定の場合にバインドされるため、乗数が一部のに対して正になります。あればと言ってちょうどダムの方法です、その後及びその逆。qi0μiiμiqi=0μi>0qi=0
Matthew Gunn 2016

答えてくれてありがとう。あなたの結果を再現したいと思っていましたが、Rを使用していましたが、それはそれほど簡単ではないようです。
ハラドニエミ2016

@jaradniemi私のRはあまり良くありませんが、以前にRで何らかの最適化を行ったことがある人から簡単なコードを入手できるでしょう。私がしたように定義された行列、凸型最小化問題をおよび。言った、この問題のまわりで私だますから、それが選ぶものと思わかなり近いためであるかなり(例えば最初の図を参照)が滑らかになるように、あなたはないかもしれません多くを得る。Aminimizeplog(Aq)q0iqi=1q=pp
Matthew Gunn '19

3

以来解きかについてだけ解決 は、 この連立方程式の解がシンプレックスに属していない場合、引数はシンプレックスの面にあります。q=p

argminqpilog{pi/qi}
qi1+qi+qi+1=3pii=1,,n1
argmaxqpilog{pi/(qi1+qi+qi+1)}
Rn+1

1
タイプミス、それはarg minでなければなりません。はと同等の問題minqipi(logpilogqi)maxqipilogqi
Matthew Gunn

ありがとう、マシュー、私は最終的に私のエントリを適切に読む時間を見つけました!
西安

2

私がこれを正しく理解していれば、これが閉じた形の解決策になるとは思いません。または、それは少なくとも閉じた形式ではない問題の特殊化です。

これが私が言う理由は、インターバル打ち切りデータのNPMLEに現れる可能性とまったく同じであるためです。特殊化は、すべてのインターバルがの形式であることです。一般に、NPMLEは関数の最大化子です[X1,X+1]

i=1nlog(P(ti[Li,Ri]))

ここで、はサブジェクトイベント時間です。ここでわかっているのは、イベントが間隔内で発生したことです。これは、および場合の問題とまったく同じです。tii[Li,Ri]Li=Xi1Ri=Xi+1

一般に、これは閉じた形式ではありません。ただし、少なくとも1つの特殊なケースがあります。現在のステータスデータ、又はときに、すべての間隔がフォームであるまたは。[0,ci][ci,)

そうは言っても、NPMLEを解くためのアルゴリズムはたくさんあります!関数にRicenRegパッケージを使用してそれに合わせることができic_npます(注:私は作成者です)。B = c(1,1)間隔が閉じていることを宣言して、オプションを必ず設定してください。

を最大化する関数がも最大化するわけではないことに注意してください。簡単な例として、仮定。そしてと0が他最大限しかしため未定義である。qE[q(X1)+...]E[log(q(X1)+...]X1=1,X2=1,X3=10q(1)=1E[q(X1)+...]E[log(q(X1)+...]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.