タグ付けされた質問 「cdf」

累積分布関数。PDFは確率変数の各値の確率密度を示しますが、CDF(多くの場合、Fバツ)確率変数が指定された値以下になる確率を与えます。


3
打ち切りデータの推定CDFプロットの現象の名前
私のデータセットには、2つの(かなり強く相関している)変数(アルゴリズムのランタイム)と(検査されたノードの数など)が含まれています。アルゴリズムは1秒あたり約ノードを管理できるため、どちらも設計によって強く相関しています。n ctttんnnccc アルゴリズムはいくつかの問題で実行されましたが、タイムアウト後に解決策が見つからなかった場合、アルゴリズムは終了しました。したがって、データは時間変数で右打ち切りになります。TTT アルゴリズムが終了した場合の変数の推定累積密度関数(または累積カウント)をプロットします。これは、最大ノードを拡張することで解決できる問題の数を示し、アルゴリズムのさまざまな構成を比較するのに役立ちます。しかし、のプロットでは、下の画像に見られるように、鋭い右上にある面白い尾があります。打ち切りが行われた変数のecdfを比較します。t &lt; T n n tんnnt &lt; Tt&lt;Tt<Tんnnんnnttt 累積数んnn 累積数ttt シミュレーション これが発生する理由を理解し、次のRコードを使用してシミュレーションで効果を再現できます。これは、いくらかのノイズが加わった状態で、強相関変数の打ち切りによって引き起こされます。 qplot( Filter(function(x) (x + rnorm(1,0,1)[1]) &lt; 5, runif(10000,0,10)), stat="ecdf",geom="step") この現象はどのように呼ばれますか? これらのファンは実験の成果物であり、実際の分布を反映していないことを、出版物に記載する必要があります。

1
制服の比率の分布:何が問題なのですか?
とが区間[0,1]の 2つのiid一様確率変数であると仮定し ます。XXXYYY[0,1][0,1][0,1] してみましょうZ=X/YZ=X/YZ=X/Y、私はのCDF探していますZZZ、すなわちPr(Z≤z)Pr(Z≤z) \Pr(Z\leq z) 。 今、私はこれを行う2つの方法を考え出しました。1つはpdfと一致する正しい答えを生成します:http : //mathworld.wolfram.com/UniformRatioDistribution.html、もう1つは生成しません。2番目の方法が間違っているのはなぜですか? 最初の方法 Pr(Z≤z)=Pr(X/Y≤z)=Pr(X≤zY)=∫10∫min(1,zy)0dxdy=∫10min(1,zy) dyPr(Z≤z)=Pr(X/Y≤z)=Pr(X≤zY)=∫01∫0min(1,zy)dxdy=∫01min(1,zy) dy\newcommand{\rd}{\mathrm{d}} \Pr(Z\leq z) = \Pr(X/Y\leq z) = \Pr(X\leq zY) = \int^{1}_{0}\int^{\min(1,zy)}_{0} \rd x \rd y = \int^{1}_{0}\min(1,zy)\ \rd y =⎧⎩⎨∫1 / z0zy dy+∫11 / zd y∫10zy d y:z&gt; 1:z≤ 1={∫01/zzy dy+∫1/z1dy:z&gt;1∫01zy dy:z≤1 = \left\{ \begin{array}{lr} \int^{1/z}_{0}zy\ \rd …

1
ベータ二項cdf、sf、ppfで使用する一般化された超幾何関数を実装する方法は?
私はscipy.stats._distn_infrastructure.rv_discreteそのPMFがベータ二項分布のサブクラスを書いています P(X=k∣N,α,β)(Nk)B(k+α,N−k+β)B(α,β),P(X=k∣N,α,β)(Nk)B(k+α,N−k+β)B(α,β),P(X=k \mid N, \alpha, \beta){N \choose k} \frac{\mathrm{B}(k+\alpha,N-k+\beta)}{\mathrm{B}(\alpha,\beta)}, ここで、BB\mathrm{B}はベータ関数です。私のCDFとSF(生存関数、1-CDFに相当)の現在の実装は不正確です。私が採用した戦略は、ベータ成分に関して二項累積分布関数の期待値を計算します。 PBB(X≤k∣N,α,β)=Ep[PBinom(X≤k∣N,p)],PBB(X≤k∣N,α,β)=Ep[PBinom(X≤k∣N,p)],P_{BB}(X \le k \mid N, \alpha, \beta) = E_p\left[P_{Binom}(X \le k \mid N, p)\right], where p∼Beta(α,β)p∼Beta(α,β)p \sim \mathrm{Beta}(\alpha, \beta)。私scipy.stats.beta.expectは、本来はベクトル化されていないメソッドを使用してこれを実現しています(floatまたは0d配列以外ではクラッシュします)。 PPFはさらに悪くなる-それは、ブルートフォース整数をループだk=0,…,Nk=0,…,Nk=0, \ldots, Nよう P(X≤k∣N,α,β)≤q.P(X≤k∣N,α,β)≤q.P(X\le k \mid N, \alpha, \beta) \le q. ウィキペディアによると、ベータ二項分布の生存関数は P(X&gt;k∣N,α,β)=B(β+n−k−1,α+k+1)3F2(a,b;k)B(α,β)B(n−k,k+2)(n+1),P(X&gt;k∣N,α,β)=B(β+n−k−1,α+k+1)3F2(a,b;k)B(α,β)B(n−k,k+2)(n+1),P(X > k \mid N, \alpha, \beta) = \frac{\mathrm{B}(\beta+n-k-1,\alpha+k+1)_3F_2(\boldsymbol{a},\boldsymbol{b};k)} …

1
おおよそのメトロポリスアルゴリズム-意味がありますか?
少し前に西安は、PDFのMCMCのcdfsに相当するものは何ですかと尋ねました?素朴な答えは、「近似」メトロポリスアルゴリズムをフォームで使用することです。 与えられた X(t)=x(t)X(t)=x(t)X^{(t)} = x^{(t)} 1.生成する Y∼q(y|x(t))Y∼q(y|x(t))Y \sim q(y|x^{(t)}) 2.取る X(t+1)={Yx(t) with probability otherwise.min(F(Y+ε)−F(Y−ε)F(x(t)+ε)−F(x(t)−ε),1)X(t+1)={Y with probability min(F(Y+ε)−F(Y−ε)F(x(t)+ε)−F(x(t)−ε),1)x(t) otherwise. X^{(t+1)} = \begin{cases} Y & \text{ with probability } & \min\left( \frac{F(Y+\varepsilon) - F(Y-\varepsilon)}{F(x^{(t)}+\varepsilon) - F(x^{(t)}-\varepsilon)} , 1 \right)\\ x^{(t)} & \text{ otherwise.} \end{cases} ここで、はターゲットCDFで、は小さな定数です。これにより、CDFでMetropolisアルゴリズムを使用できるようになります。FFFεε\varepsilon 問題は、これが実際に悪い考えかもしれない理由があるのでしょうか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.