タグ付けされた質問 「pdf」

連続確率変数の確率密度関数(PDF)は、可能な各値の相対確率を示します。このタグは、離散確率質量関数(PMF)にも使用します。

4
infoGANペーパーに含まれる補題の統合アイデンティティ
infoGANの論文で見出しを見つけました。論文の補遺にある補題5.1の由来がわかりません。次のようになります(pngとして含まれています)。 最後のステップがわかりません。なぜを最も内側の積分にプルして、に変換できるのですか?適切な規則性条件は何ですか?f(x,y)f(x,y)f(x,y)f(x′,y)f(x′,y)f(x',y)fff

1
ガウス確率変数の2次多項式の分布
を計算したい P(Y= a X2+ b X+ c &lt; 0 )P(Y=aX2+bX+c&lt;0)P(Y=aX^2+bX+c<0) ここで、です。モンテカルロを使えば簡単にできます。ただし、私は分析pdfを見つけて計算するように求められましたF Y(Y )Yバツ〜N(0 、σ)X∼N(0,σ)X \sim N(0,\sigma)fY(y)fY(y)f_Y(y)YYY 私= ∫0- ∞fY(y)dyI=∫−∞0fY(y)dyI=\int_{-\infty}^0 f_Y(y) dy 私は推測あるようになり唯一の数値計算することができます。ただし、これは一変量の積分であるため、非常に高い精度で計算するための数値手法を利用できます。(比較的単純な)式があるので、数値積分を実行できますか?または、モンテカルロ(私の意見では最も賢明なアプローチです)以外、を計算する別の可能性はありますか? I f Y(y )IfY(y)fY(y)f_Y(y)私IIfY(y)fY(y)f_Y(y)私II

2
従属変数の合計のPDF
これは私の最近の質問の直接の続きです。実際に取得したいのは、ここは均一です。これで、が上記のスレッドで正常に計算されました。これをと呼びましょう。の分布は、単にです。最後のステップは、との合計の分布を前の方法と同様の方法ですることですが、と、B、C、D[0、1](-D)2+4bはC √a + d+ (a − d)2+ 4 b c−−−−−−−−−−−√a+d+(a−d)2+4bca+d+\sqrt{(a-d)^2+4bc}a 、b 、c 、da,b,c,da,b,c,d[ 0 、1 ][0,1][0,1](a − d)2+ 4 b c(a−d)2+4bc(a-d)^2+4bch (x )h(x)h(x) H(X2)⋅2XX=A+DY= √(a − d)2+ 4 b c−−−−−−−−−−−√(a−d)2+4bc\sqrt{(a-d)^2+4bc}h (x2)⋅ 2 Xh(バツ2)⋅2バツh(x^2)\cdot 2xバツ= a + dバツ=a+dX=a+dY= (a − d)2+ 4 b c−−−−−−−−−−−√Y=(a−d)2+4bcY=\sqrt{(a-d)^2+4bc}YバツバツXYYY 独立していないので、今は行き詰まっており、どこから始めればよいのかもわかりません。 注意することは有用であり得ることを部品ルートの下、後者(すなわち、および)は簡単に計算できます。次に、との分布を知っているの分布に興味があります。 X2=(a+d)2W=−4(ad−bc)X+ √(a − d)2+ 4 …


2
通常の切り捨てられた確率変数の合計
私が持っていると仮定しの独立した正規確率変数んnn バツ1〜N(μ1、σ21)バツ2〜N(μ2、σ22)⋮バツん〜N(μん、σ2ん)X1∼N(μ1,σ12)X2∼N(μ2,σ22)⋮Xn∼N(μn,σn2)X_1 \sim \mathrm{N}(\mu_1, \sigma_1^2)\\X_2 \sim \mathrm{N}(\mu_2, \sigma_2^2)\\\vdots\\X_n \sim \mathrm{N}(\mu_n, \sigma_n^2) および。各の分布がそれぞれ内に切り捨てられている場合、の密度をどのように特徴付けますか?つまり、独立した正規分布からサンプリングし、各平均の内にないサンプルを破棄して、それらを合計しています。 Y X I(μ I - 2 σ I、μ I + 2 σ I)N 2 σ IY= X1+ X2+ ⋯ + XんY=X1+X2+⋯+XnY=X_1+X_2+\dotsm+X_nYYYバツ私XiX_i(μ私- 2 σ私、μ私+ 2 σ私)(μi−2σi,μi+2σi)(\mu_i - 2\sigma_i, \mu_i + 2\sigma_i)んnn2つのσ私2σi2\sigma_i 現在、私は以下のRコードでこれを行っています: x_mu &lt;- c(12, 18, 7) x_sd &lt;- …

1
逆確率重みの計算—条件付き(多変量)密度推定?
一般的なバージョン: 私は推定する必要があると連続して多変量です。良い関数形を心に留めておらず、は公平なものである必要があるため、ノンパラメトリックにしたいと思います。条件付きカーネル密度推定器を使用したかったのですが、最初にを量子化する必要があることに気付きました。それから私は推定するためのアイデアだったとF(X )という計算にデータや使用からのF(A | X )、または多分私はどこかでそれを読んで、覚えていませんどこ。A X F(A | X )X F(A 、X )f(A|X)f(A|X)f(A | X)AAAXXXf^(A|X)f^(A|X)\hat{f}(A | X)XXXf^(A,X)f^(A,X)\hat{f}(A , X)f^(X)f^(X)\hat{f}(X)f^(A|X)f^(A|X)\hat{f}(A | X) この手順が有効ではない理由はありますか?カーネル密度よりも良いまたはより正直なアプローチはありますか?また、ノンパラメトリックにサンプル密度から人口密度を推定することに問題はありますか?データは調査データであり、私には調査の重みがあります。どういうわけかそれらを組み込む必要がありますか? ケース固有のバージョン: Robins(2000)(ゲートされていないPDF)のように、これらの推定値を周辺構造モデルでの治療の確率の逆数の重みに使用することに言及する価値があるでしょう。私は「治療」の配列観察{at}4t=0{at}t=04\{a_t\}_{t=0}^{4}と時間変動交絡因子のシーケンス{xt}4t=0{xt}t=04\{x_t\}_{t=0}^{4}いくつかの結果に対するy~y~\tilde{y}で生じるt=T+1t=T+1t=T+1。単純なパラメトリック因果関係、ただし、時変交絡因子があるため、βは「平均治療効果」の偏った推定であり、因果パス上にあるため、交絡因子をリグレッサとして追加できません。βにもバイアスをかけます。幸いドクロビンスはI再重量私の観測場合、私はにより交絡/公平かつ合理的に効率的な推定値を得ることができることを考え出した wが、私は= 4 Π S=0、F(S|A S &lt; T)をE[ Y〜| a⃗ ] = β』a⃗ E[Y~|a→]=β′a→E[\tilde{Y} | \vec{a}]=\beta'\vec{a}ββ\betaββ\betaw私= ∏s = 04f(as| as &lt; t)f(as| as &lt; t、xs &lt; …

2
密度が指数関数であるかどうかの確認
これが指数関数的ファミリーに属していないことを証明しようとしています。 f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4\frac{(y+a)}{(1+4a)} ; 0 < y < 1 , a>0 これが私のアプローチです: f(y|a)=4(y+a)e−log(1+4a)f(y|a)=4(y+a)e−log(1+4a)f(y|a) = 4(y+a)e^{-log(1+4a)} f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a) = (4y)(1+\frac{a}{y})e^{-log(1+4a)} 標準形式と比較すること、及びのみの関数であることを有する、の観点から定義することができないように、単独で、におけるは不可分です。これは、この分布が指数ファミリーに属していないことを示すのに十分ですか?g (a )a a y 1 + ah(y)=4yh(y)=4yh(y) = 4yg(a)g(a)g(a)aaaaaayyy1+ay1+ay1+\frac{a}{y} 私のアプローチを確認してください。


2
カーネル密度チャートを説明する
線形モデルでシミュレーションを実行しています。1000の結果が得られ、結果は密度チャートに入れられます。私はx軸が従属変数であり、y軸がカーネル密度を表すことを理解しています。Y軸は0から0.15のような10進数です。これを他のユーザーに説明するにはどうすればよいですか?シミュレーションされた値がx1とx2の間に入る確率は15%ですか? これは私のシミュレーション出力です: summary(s) Model: ls Number of simulations: 1000 Values of X (Intercept) Volume 1 1 1699992 attr(,"assign") [1] 0 1 Expected Values: E(Y|X) mean sd 50% 2.5% 97.5% 1 12.305 2.638 12.231 7.03 17.512

1
RまたはRPyの逆ガンマ分布の最尤推定
3つのパラメーターの逆ガンマ分布をRまたはPythonのデータに適合させようとしています。最尤推定(MLE)を使用してこれを実行したいと思います。 3つのパラメーターの逆ガンマのpdfは、次の式で与えられます。 ここで、Γはガンマ関数、ρは形状、αはスケール、sは位置パラメーターです。 私はこのディストリビューションに対して直接MLEを実行できるRパッケージを発見していません(知っている場合はお知らせください!)。だから私はこれがどちらかを残すと思います: (A)式の対数尤度関数を計算する (B)データをガンマ分布に変換する。ただし、この分布には2つのパラメーターしかないため、3番目のパラメーターの計算方法がわかりません(私はあまり数学者ではありません!)。 MLEを使用して逆ガンマ分布を私のデータに合わせる方法についての助けがあれば大歓迎です!よろしくお願いします。

2
2つの一様分布の結合分布と周辺分布の計算に関する問題
我々は、ランダムな変数があるととして配布およびとして配布 、間隔で一様分布を意味する。 U [ 0 、1 ] X 2 U [ 0 、X 1 ] U 〔、B ] [ 、B ]バツ1X1X_1U[ 0 、1 ]U[0,1]U[0,1]バツ2X2X_2U[ 0 、X1]U[0,X1]U[0,X_1]U[ a 、b ]U[a,b]U[a,b][ a 、b ][a,b][a,b] Iは、関節PDFを計算することができたとの限界PDF。X 1(X1、X2)(X1,X2)(X_1,X_2)バツ1X1X_1 p (x1、x2)= 1バツ1、 のために 0 ≤ X1≤ 1 、0 ≤ X2≤ X1、p(x1,x2)=1x1, for 0≤x1≤1,0≤x2≤x1, p(x_1,x_2) = …

2
打ち切られた分布による密度推定?
左側が切り捨てられているデータがあります。私はそれを平滑化しようとするのではなく、何らかの方法で処理する密度推定に適合させたいと思います。 これに対処できる既知の方法(通常、Rで) サンプルコード: set.seed(1341) x &lt;- c(runif(30, 0, 0.01), rnorm(100,3)) hist(x, br = 10, freq = F) lines(density(x), col = 3, lwd = 3) ありがとう:)

1
ガンマ分散待機時間を備えた有限状態マシン
正と負の入力を持つステートマシンがあります。正の入力間の時間はガンマ分布に従い()、負の入力間の時間は異なるガンマ分布に従います()。したがって、一定の時間間隔で正と負の入力を受け取る確率は、すべてのについて正確にます。ステートマシンを以下に示します。X+∼Γ(k+,θ+)X+∼Γ(k+,θ+)X_+ \sim \Gamma(k_+, \theta_+)X−∼Γ(k−,θ−)X−∼Γ(k−,θ−)X_- \sim \Gamma(k_-, \theta_-)KKKKKK 青いボックスはマシンで達成可能な状態を表し、実線と破線はそれぞれ正と負の入力を表します。たとえば、マシンが状態3にあり、正の入力が到着した場合、マシンは正の出力を生成し、状態2にリセットされます。その後、マシンが負の入力を受け取ると、出力を生成せずに状態1に移行します。 ポジティブ出力のPMFを見つけることは可能ですか?つまり、すべてのについて同じ時間間隔で正の出力が得られる確率はどれくらいですか。KKKKKK

2
が均一かつ通常選択されている場合、球面仰角はどのように分布しますか?
フォローアップとして 極座標方法、、分散されたときにとIF?θθ\theta(x,y)∼U(−1,1)×U(−1,1)(x,y)∼U(−1,1)×U(−1,1)(x,y) \sim U(-1,1) \times U(-1,1)(x,y)∼N(0,1)×N(0,1)(x,y)∼N(0,1)×N(0,1)(x,y) \sim N(0,1)\times N(0,1) 仮定どのようにしている及び分散しますか?(x,y,z)∼U(−10,10)×U(−10,10)×U(−10,10)(x,y,z)∼U(−10,10)×U(−10,10)×U(−10,10)(x,y,z) \sim U(-10,10) \times U(-10,10) \times U(-10,10)θθ\thetaϕϕ\phi が次のようになるのは、前の質問のすばらしい回答から明らかです。 θθ\theta しかし、なぜがで最大尤度を取得しないのですか?ϕϕ\phiϕ=π/4ϕ=π/4\phi = \pi/4 正規分布でを選択すると次の2つのpdfが得られます。x,y,zx,y,zx,y,z および分布の名前はどちらの場合にもありますか?私にとっては、区間分布のように見えます。θθ\thetaϕϕ\phiββ\beta[−90,90][−90,90][-90,90]

1
ランダムサンプリングによる最適化
インターネットの周りで、目的関数を再スケーリングし、それを最適化の目的でPDFとして使用するアイデアへの言及が散らばっています。(このサイトの例:最適化手法はサンプリング手法に対応していますか?)この手法について詳しく知ることができる場所を誰かに教えてもらえますか?(論文、ブログ投稿、講義など) 私が見てきたように、目的は目的関数を取り、新しい関数。ここで、は最大化問題の非常に大きな数ですまたは最小化問題の非常に大きな負の数。その場合、新しい関数は、他のどこよりも大域的最適点ではるかに高くなります。場合は次いで、非正規化確率密度関数として扱われ、その分布から引き出されたほとんどのサンプルは、その最適の周りであろう。f(x)f(x)f(x)g(x)=ekf(x)g(x)=ekf(x)g(x) = e^{kf(x)}kkkg(x)g(x)g(x)g(x)g(x)g(x) 知りたいことは次のとおりですが、これらに限定されません。 これらの確率関数にはどのサンプリングアルゴリズムが有効ですか? この方法が頻繁に使用されないのはなぜですか?(それはそれがとても効果的であるように思えます)。つまり、それに反対する議論はありますか? 効率やパフォーマンスを向上させるこの方法の変形はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.