タグ付けされた質問 「conditional-probability」

別のイベントBが発生した、または発生したことがわかっているときに、イベントAが発生する確率。通常、P(A | B)で表されます。

4
カードを引いた後、エース、2、3などを獲得するまでの数字
以下を解決するのに苦労しています。 エースを獲得するまで、標準の52カードデッキからカードを交換せずに引きます。2を得るまで残っているものから引きます。3に進みます。デッキ全体がなくなった後、予想される数はどれくらいですか。 させるのは自然でした Ti=first position of card whose value is iTi=first position of card whose value is iT_i = \text{first position of card whose value is }i Ui=last position of card whose value is iUi=last position of card whose value is iU_i = \text{last position of card whose value is …

3
Naive Bayesは確率を特徴としています:単語を二重にカウントすべきですか?
私は自分のNaive Bayesのバッグo '単語モデルのプロトタイプを作成していますが、機能の確率の計算について質問がありました。 私は2つのクラスを持っているとしましょう、それは誰もが使用するものなので、私はただスパムと非スパムを使用します。そして、「バイアグラ」という言葉を例に取りましょう。トレーニングセットには10​​通のメールがあり、5通のスパムと5通の非スパムがあります。「viagra」は、5つのスパム文書すべてに表示されます。トレーニングドキュメントの1つで、3回表示されます(これが私の質問です)。これは、合計で7回表示されます。非スパムトレーニングセットでは、1回表示されます。 p(viagra | spam)を推定したい場合、それは単純です: p(viagra | spam)= 5つのスパム文書にviagraが含まれる/合計5つのスパム文書= 1 言い換えれば、1つのドキュメントが1回ではなく3回バイアグラについて言及しているという事実は本当に重要ではないのでしょうか? 編集:ここに著者が私がちょうどレイアウトしたアプローチを使用するブログ投稿があります:http: //ebiquity.umbc.edu/blogger/2010/12/07/naive-bayes-classifier-in-50-lines/ そして、ここに著者が言うブログ投稿があります:p(viagra | spam)= 7 viagra spam言及/合計8言及 http://www.nils-haldenwang.de/computer-science/machine-learning/how-to-apply -単純なベイズ分類器からドキュメント分類問題へ そして、以下の答えの1つは、それがあるべきだと言っています:p(viagra | spam)= 7 viagra言及のスパム/スパムの合計用語数 これについて意見を述べるソースに誰でもリンクできますか?


1
フィッシャーの厳密検定と超幾何分布
私はフィッシャーの正確なテストをよりよく理解したかったので、次のおもちゃの例を考案しました。ここで、fとmは男性と女性に対応し、nとyは次のように「ソーダ消費」に対応します。 > soda_gender f m n 0 5 y 5 0 明らかに、これは大幅な簡略化ですが、コンテキストが邪魔になりたくありませんでした。ここで私は男性がソーダを飲まず、女性がソーダを飲まないと仮定し、統計手順が同じ結論になるかどうかを確認したかっただけです。 Rでフィッシャーの正確検定を実行すると、次の結果が得られます。 > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.0000000 0.4353226 sample estimates: odds ratio 0 ここでは、p値が0.007937であるため、性別とソーダ消費が関連付けられていると結論付けます。 フィッシャーの正確な検定が超幾何分布に関連していることを知っています。だから私はそれを使って同様の結果を得たいと思った。つまり、この問題は次のように表示できます。10個のボールがあり、5個が「男性」、5個が「女性」とラベル付けされており、交換せずに5つのボールをランダムに描画すると、0個の男性ボールが表示されます。 。この観察の可能性は何ですか?この質問に答えるために、次のコマンドを使用しました。 …

1
条件付き分布を使用した周辺分布からのサンプリング?
一変量密度からサンプリングしたいのですが、関係はわかっています。fバツfXf_X fバツ(x )= ∫fバツ| Y(x | y)fY(y)dy。fX(x)=∫fX|Y(x|y)fY(y)dy.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. MCMC(積分表現に直接)の使用を避けたいので、とf Y(y )は簡単にサンプリングできるため、次のサンプラーを使用することを考えていました。fバツ| Y(x | y)fX|Y(x|y)f_{X\vert Y}(x\vert y)fY(y)fY(y)f_Y(y) 。j = 1 、… 、Nj=1,…,Nj=1,\dots, N サンプル。yj〜FYyj∼fYy_j \sim f_Y サンプル。バツj〜Fバツ| Y(⋅ | yj)xj∼fX|Y(⋅|yj)x_j \sim f_{X\vert Y}(\cdot\vert y_j) 次に、ペア終わります。。。、(x N、y N)、および限界サンプル(x 1、… 、x N)のみを取得します。 これは正しいです?(x1、y1)、。。。、(xN、yN)(x1,y1),...,(xN,yN)(x_1,y_1),...,(x_N,y_N)(x1、… 、xN)(x1,…,xN)(x_1,\dots,x_N)

1
多変量正規分布と共変量を使用したベイズモデリング
説明変数があるとします。ここで、sは特定の座標を表します。また、応答変数Y = ( Y (s 1)、… 、Y (s n))があります。これで、両方の変数を次のように組み合わせることができます。X=(X(s1),…,X(sn))X=(X(s1),…,X(sn)){\bf{X}} = \left(X(s_{1}),\ldots,X(s_{n})\right)sssY=(Y(s1),…,Y(sn))Y=(Y(s1),…,Y(sn)){\bf{Y}} = \left(Y(s_{1}),\ldots,Y(s_{n})\right) W(s)=(X(s)Y(s))∼N(μ(s),T)W(s)=(X(s)Y(s))∼N(μ(s),T){\bf{W}}({\bf{s}}) = \left( \begin{array}{ccc}X(s) \\ Y(s) \end{array} \right) \sim N(\boldsymbol{\mu}(s), T) この場合、我々は単に選択とTは関係について説明共分散行列であり、X及びYは。これは、sでのXとYの値のみを示します。XとYの他の場所からのポイントが多いため、次のように W(s)のより多くの値を記述できます。μ(s)=(μ1μ2)Tμ(s)=(μ1μ2)T\boldsymbol{\mu}(s) = \left( \mu_{1} \; \; \mu_{2}\right)^{T}TTTXXXYYYXXXYYYsssXXXYYYW(s)W(s){\bf{W}}(s) (XY)=N((μ11μ21),T⊗H(ϕ))(XY)=N((μ11μ21),T⊗H(ϕ))\left( \begin{array}{ccc} {\bf{X}} \\ {\bf{Y}} \end{array}\right) = N\left(\left(\begin{array}{ccc}\mu_{1}\boldsymbol{1}\\ \mu_{2}\boldsymbol{1}\end{array}\right), T\otimes H(\phi)\right) とYのコンポーネントを再配置して、列内のすべてのX (s i)を取得し、その後、すべてのY (s i)を連結します。各成分H (ϕ )i …

1
R / mgcv:なぜte()とti()テンソル積が異なる表面を生成するのですか?
のmgcvパッケージにRは、テンソル積の相互作用をフィッティングするための2つの関数がte()ありti()ます。私は2つの作業の基本的な分業を理解しています(非線形の相互作用を当てはめるか、この相互作用を主効果と相互作用に分解するか)。私が理解していないのは、なぜte(x1, x2)、そしてti(x1) + ti(x2) + ti(x1, x2)(わずかに)異なる結果を生成するのかということです。 MWE(から適応?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
事後密度が以前の密度と尤度関数の積に比例するのはなぜですか?
ベイズの定理によれば、です。しかし、私の計量経済テキストによれば、それはであると述べています。なぜこんな感じ?が無視される理由がわかりません。P (θ | y )∝ P (y | θ )P (θ )P (y )P(y| θ)P(θ )= P(θ | y)P(y)P(y|θ)P(θ)=P(θ|y)P(y)P(y|\theta)P(\theta) = P(\theta|y)P(y)P(θ | y)∝ P(y| θ)P(θ )P(θ|y)∝P(y|θ)P(θ)P(\theta|y) \propto P(y|\theta)P(\theta)P(y)P(y)P(y)


2
BUGS / JAGSのようなプログラムはどのようにしてギブスサンプリングの条件付き分布を自動的に決定しますか?
多くの場合、完全な条件文は導出するのが非常に難しいようですが、JAGSやBUGSのようなプログラムはそれらを自動的に導出します。誰かが任意のモデル仕様の完全な条件をアルゴリズム的に生成する方法を説明できますか?

5
信頼区間と確率-このステートメントのエラーはどこにありますか?
誰かが以下のような声明を出した場合: 「全体として、環境の煙にさらされた非喫煙者は、煙にさらされなかった非喫煙者と比較して、冠状動脈性心臓病の相対リスクが1.25(95%信頼区間、1.17〜1.32)でした。」 全体としての人口の相対リスクは何ですか?冠状動脈性心臓病に関連するものはいくつありますか?テストできる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどないため、ランダムに選択された特定のものが関連している可能性はほとんどありません。したがって、母集団の相対リスクは1であると言えますが、引用された間隔には値1が含まれていません。したがって、実際には2つのものの間に関連があり、その確率は非常に小さいか、またはこれは次のいずれかです。パラメータを含まない5%の間隔。後者は前者よりはるかに可能性が高いので、それは私たちが仮定するべきものです。したがって、適切な結論は、データセットがほぼ確実に母集団の非定型であったことです。 もちろん、5%以上が冠状動脈性心疾患に関連していると仮定する根拠がある場合、統計には、環境煙がその1つであるという示唆を裏付ける証拠がいくつかある可能性があります。常識では、これはありそうもないことです。 彼らの推論の誤りは何ですか(すべての保健機関は間接喫煙の有害な影響に関する重要な文献があることに同意しているので)?「検査できる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどない」という彼らの前提のせいですか?この文は、ランダムに選択された要因(すなわち、冠動脈疾患のリスクがある人が犬を何匹所有するか)に当てはまる可能性がありますが、先験的確率は、「任意のランダムな要因」よりも、受動喫煙および冠状動脈性心臓病の方がはるかに高いです。 これは正しい推論ですか?または他に何かありますか?

3
が連続で
言うYYY連続確率変数であり、そしてXXX離散的なものです。 Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y) \Pr(X=x|Y=y) = \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)} ご存知のように、Yは連続確率変数であるため、です。そして、これに基づいて、確率Pr (X = x | Y = y )は未定義であると結論づけたくなります。Pr(Y=y)=0Pr(Y=y)=0\Pr(Y=y) = 0YYYPr(X=x|Y=y)Pr(X=x|Y=y)\Pr(X=x|Y=y) しかし、ウィキペディアはここに主張する:以下のように、それが実際に定義されていること Pr(X=x|Y=y)=Pr(X=x)fY|X=x(y)fY(y)Pr(X=x|Y=y)=Pr(X=x)fY|X=x(y)fY(y) \Pr(X=x|Y=y) = \frac{\Pr(X=x) f_{Y|X=x}(y)}{f_Y(y)} 質問:ウィキペディアがその確率を定義するためにどのように管理したのですか? 私の試み 制限に関してWikipediaの結果を取得するための私の試みは次のとおりです: Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)=limd→0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=limd→0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=Pr(X=x)fY|X=x(y)fY(y)Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)=limd→0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=limd→0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=Pr(X=x)fY|X=x(y)fY(y)\begin{split}\require{cancel} \Pr(X=x|Y=y) &= \frac{\Pr(X=x)\Pr(Y=y|X=x)}{\Pr(Y=y)}\\ &= \lim_{d \rightarrow 0}\frac{\Pr(X=x) \big(d \times f_{Y|X=x}(y)\big)}{\big(d \times f_Y(y)\big)}\\ &= \lim_{d \rightarrow 0}\frac{\Pr(X=x) \big(\cancel{d} \times f_{Y|X=x}(y)\big)}{\big(\cancel{d} \times f_Y(y)\big)}\\ &= \frac{\Pr(X=x) f_{Y|X=x}(y)}{f_Y(y)}\\ …

2
与えられたある確率は何ですか?
XXXとYYYが平均μ=(μ1,μ2)μ=(μ1,μ2)\mu=(\mu_1,\mu_2)と共分散 \ Sigma = \ begin {bmatrix} \ sigma_ {11}&\ sigma_ {12} \\ \ sigma_ {12}&\ sigma_の 2変量正規であると仮定します{22} \\ \ end {bmatrix}Σ=[σ11σ12σ12σ22]Σ=[σ11σ12σ12σ22]\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}。確率Pr(X&lt;Y|min(X,Y))Pr(X&lt;Y|min(X,Y))\Pr\left(X<Y|\min\left(X,Y\right)\right)何ですか?

2
多項分布の係数の合計
\newcommand{\P}{\mathbb{P}}私は公平なサイコロを投げています。1、2、または3を取得するたびに、「1」を書き留めます。4を取得するたびに、「2」を書き留めます。5または6を取得するたびに、「3」を書き留めます。 してみましょうNNNの総数は私はあることを書き留めたすべての数値の積のために必要なスロー可能≥100000≥100000\geq 100000。\ P(N \ geq 25)を計算(または概算)したいのですP(N≥25)P(N≥25)\P(N\geq 25)が、正規分布の関数として概算を与えることができます。 まず、\ log_3 100.000 \約10.48であるため、P(N≥11)=1P(N≥11)=1\P(N\geq 11) = 1ことがlog3100.000≈10.48log3⁡100.000≈10.48\log_3 100.000 \approx 10.48。ここで、aaa、bbb、cccそれぞれ1、2、3と書き留めた回数とします。次に: P(a,b,c∣n)=⎧⎩⎨⎪⎪(na,b,c)(12)a(16)b(13)c0 if a+b+c=n otherwiseP(a,b,c∣n)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise\P(a,b,c\mid n) = \begin{cases}\displaystyle\binom {n}{a, b, c} \left(\frac 1 2\right) ^ a \left(\frac 1 6\right)^b\left(\frac 1 3\right)^c &\text{ if } a + b + c = …

1
証明/反証
証明/反証E[1A|Ft]=0 or 1 a.s. ⇒E[1A|Fs]=E[1A|Ft] a.s.E[1A|Ft]=0 or 1 a.s. ⇒E[1A|Fs]=E[1A|Ft] a.s.E[1_A | \mathscr{F_t}] = 0 \ \text{or} \ 1 \ \text{a.s.} \ \Rightarrow E[1_A | \mathscr{F_{s}}] = E[1_A | \mathscr{F_t}] \ \text{a.s.} フィルター処理された確率空間が与えられると、。(Ω,F,{Fn}n∈N,P)(Ω,F,{Fn}n∈N,P)(\Omega, \mathscr{F}, \{\mathscr{F}_n\}_{n \in \mathbb{N}}, \mathbb{P})A∈FA∈FA \in \mathscr{F} 仮定それは従ってい何についての?∃t∈N s.t. E[1A|Ft]=1 a.s.∃t∈N s.t. E[1A|Ft]=1 a.s.\exists t \in \mathbb{N} …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.