私の答えの要約。私はマルコフ連鎖モデリングが好きですが、「時間的」側面が欠けています。一方、時間的側面(例:平均時間)に焦点を合わせると、「遷移」側面が失われます。私は、次の一般的なモデリングに入ります(適切な仮定を使用すると、[markovプロセス] [1]につながります)。また、この問題の背後には多くの「検閲された」統計があります(これは確かにソフトウェアの信頼性の古典的な問題ですか?)。私の答えの最後の方程式は、特定の投票状態に対する投票強度の最尤推定量(「+」で最大、「-」でダウ)を提供します。方程式からわかるように、これは、遷移確率のみを推定する場合と、特定の状態で費やされた時間のみを測定する場合の中間です。この助けを願っています。−1
一般的なモデリング(質問と仮定を再度述べるため)。
してみましょうとそれぞれの投票日と関連投票記号(upvoteのための+1、-1 downvote用)をモデル化し、ランダムな変数です。投票プロセスは単純です(VDi)i≥1(Si)i≥1
Yt=Y+t−Y−t
ここで
Y+t=∑i=0∞1VDi≤t,Si=1 and Y−t=∑i=0∞1VDi≤t,Si=−1
ここで重要な量は、 -jump
ここで、はまたはあり、 は適切なフィルターです。 :
。ϵ
λϵt=limdt→01dtP(Yϵt+dt−Yϵt=1|Ft)
ϵ−+FtFt=σ(Y+t,Y−t,VD1,…,VDY+t+Y−t,S1,…,SY+t+Y−t)
しかし、あなたの質問の行に沿って、
これは、に決定論的シーケンスよう。
P(Yϵt+dt−Yϵt=1|Ft)=P(Yϵt+dt−Yϵt=1|Yt)
ϵ=+,−(μϵi)i∈Zλϵt=μϵYt
この形式では、「」(または少なくとも差がa所定のしきい値)。μ+−1−μ+0>0
この仮定の下で、あることを示すことは容易である上の[均質マルコフ過程] [3]ジェネレータとによって与えられますYtZQ
∀i,j∈ZQi,i+1=μ+iQi,i−1=μ−iQii=1−(μ+i+μ−i)Qij=0 if |i−j|>1
質問に答える(統計問題の最尤推定法を提案することにより)
この再定式化から、を推定し、その値を上回るテストを構築することで問題を解決します。一般性を失うことなく、インデックスを修正して忘れましょう。(および)の推定は、(μ+i)iμ+μ−
(T1,η1),…,(Tp,ηp)ここで、は状態費やされた周期のの長さです。(とすなわち回連続)とある質問は、upvotedれた場合は、それがdownvotedとされた場合は、それは観察の最後の状態だった場合。TjjthpiYt=iηj+1−10
最後の観測状態のケースを忘れた場合、言及されたカップルはおよび依存する分布からなります:(Expは指数分布からのランダムな変数で、は誰が最大値を実現するかに応じて+または-1です)。次に、次の簡単な補題を使用できます(証明は簡単です)。μ+iμ−i(min(Exp(μ+i),Exp(μ−i)),η)η
補題もし及び、その後、及び。 X+⇝Exp(μ+)X−⇝Exp(μ−)T=min(X+,X−)⇝Exp(μ++μ−)P(X+1<X−)=μ+μ++μ−
これは、密度のことを意味しの次式で与えられる。
ここでは指数確率変数の密度関数ですパラメータ。この式から、およびの最尤推定量を簡単に導出できます。f(t,ϵ)(T,η)
f(t,ϵ)=gμ++μ−(1(ϵ=+1)∗μ++1(ϵ=−1)∗μ−μ++μ−)
gaa>0aμ+μ−
(μ^+,μ^−)=argminln(μ−+μ+)((μ−+μ+)∑i=1pTi+p)−p−ln(μ−)−p+ln(μ+)
ここでおよび。
p−=|i:δi=−1|p+=|i:δi=+1|
より高度なアプローチに対するコメント
が最後に観察された状態である場合(を通過するとき、それは多くの場合あなたの最後のスコアであるため、より賢くなります)の ケースを考慮したい場合、少し推論を変更する必要があります。対応する打ち切りは比較的古典的です...i−1
考えられる他のアプローチには、
- 時間とともに減少する強度を持つ
- 最後の投票以降に費やした時間とともに減少する強度を持つ(私はこれを好む。この場合、密度がどのように減少するかをモデル化する古典的な方法がある...
- は滑らかな関数であると仮定することができます。μ+ii
- ....他のアイデアを提案できます!