タグ付けされた質問 「conditional-probability」

別のイベントBが発生した、または発生したことがわかっているときに、イベントAが発生する確率。通常、P(A | B)で表されます。

2
条件付き独立性とそのグラフィック表現に関する
共分散の選択を研究するとき、私は一度以下の例を読みました。次のモデルに関して: その共分散行列と逆共分散行列は次のように与えられます、 ここでと独立性がここで逆共分散によって決定される理由がわかりませんか?xxxyyy この関係の基礎となる数学的ロジックは何ですか? また、次の図の左側のグラフは、と間の独立関係を表すためのものです。どうして?xxxyyy

3
コインを弾く確率の深刻で深刻な問題
コインを1枚投げるとします。連続して4つ以上の連続したヘッドを得るのに必要なフリップの確率を知りたいのですが。 カウントは次のように機能します。連続する1回のフリップのカウントは、ヘッドのみ(4ヘッド以上)です。テールがヒットしてヘッドのストリークを壊すと、カウントは次のフリップから再開します。これは、10,000回のフリップで繰り返されます。 4連以上の頭だけでなく、6頭以上10頭以上の確率を知りたい。9ヘッドのストリークが達成されているかどうかを明確にするために、2つの別々のストリークではなく、1ストリークを4以上(および/または6以上)として集計します。たとえば、コインがTHTHTHTHHHHHH /// THAHTHT ....であった場合、カウントは13になり、次のテイルで再び始まります。 データが右側に大きく歪んでいるとしましょう。平均が40フリップであるので、ストリークが4以上になるには平均がかかり、分布はu = 28です。明らかにゆがんでいます。 現時点では何も見つからない場合を除いて、説明的なデータから意味のある方法を見つけるために最善を尽くしています。 私はそれからある意味のある確率を得る何らかの方法を見つけたいです。+/- 1 SDが68%である通常の曲線のように、ログの正規化を調べましたが、これは実際には私の目標ではないパラメトリックテストにのみ使用されています。 私はベータ版のディストリビューションについて教えられましたが、私がこれまでに提案したことはすべてかなり混乱しています。私は1年前にこの質問をして、いくつかの洞察を得ましたが、残念ながら、私にはまだ答えがありません。アイデアをお持ちの方、ありがとうございました。

1
条件付き密度プロットの解釈
条件付き密度プロットを正しく解釈する方法を教えてください。でRで作成したものを2つ挿入しましたcdplot。 たとえば、変数1が150の場合、結果が1になる確率は約80%ですか? 濃い灰色の領域は、条件付き確率がResult1に等しい確率です。 cdplotドキュメントから: cdplotは、yの周辺分布によって重み付けされたyのレベルを指定して、xの条件付き密度を計算します。密度は、yのレベルにわたって累積的に導出されます。 この累積は、これらのプロットの解釈にどのように影響しますか?

1
P(Y | X)の非iidサンプルとP(Y | X)のiidサンプルからの確率的勾配降下法を介してP(Y | X)のモデルをトレーニングできますか?
一部のデータセットで確率勾配降下法を介して(たとえば、可能性を最大化するために)パラメーター化されたモデルをトレーニングする場合、トレーニングサンプルはトレーニングデータ分布からiidで描画されると一般に想定されています。したがって、目標が共同分布をモデル化することである場合、各トレーニングサンプルはその分布からiidで描画されます。P(X,Y)P(X,Y)P(X,Y)(xi,yi)(xi,yi)(x_i,y_i) 代わりに条件付き分布をモデル化することが目的である場合、iid要件はどのように変化しますか?P(Y|X)P(Y|X)P(Y|X) それでも、共同分布から各サンプル iidを描画する必要がありますか?(xi,yi)(xi,yi)(x_i,y_i) から iid を描画し、次にから iidを描画しますか?xixix_iP(X)P(X)P(X)yiyiy_iP(Y|X)P(Y|X)P(Y|X) 私たちが描くことができからIIDない(例えば、時間を超える相関)、そして描きからIID?xixix_iP(X)P(X)P(X)yiyiy_iP(Y|X)P(Y|X)P(Y|X) 確率的勾配降下法に対するこれら3つのアプローチの妥当性についてコメントできますか?(または、必要に応じて質問を言い換えてください。) できれば#3をやりたいです。私のアプリケーションは強化学習であり、パラメーター化された条件付きモデルを制御ポリシーとして使用しています。状態のシーケンスは高度に相関していますが、アクションは、状態を条件とする確率的ポリシーからサンプリングされます。結果のサンプル(またはそれらのサブセット)は、ポリシーのトレーニングに使用されます。(言い換えると、ある環境で制御ポリシーを長時間実行し、状態/アクションサンプルのデータセットを収集することを想像してください。その後、状態が経時的に相関している場合でも、アクションは独立して生成され、状態を条件とします。)これは、このホワイトペーパーの状況と多少似ています。xixix_iyiyiy_i(xi,yi)(xi,yi)(x_i,y_i) 私はRyabko、2006年の「条件付き独立データのパターン認識」という論文を見つけました。ただし、状況は私が必要としているものとは逆になり、(ラベル/カテゴリ/アクション)はからiidではなく描画でき、(オブジェクト/パターン/状態)はからiidで描画されます。yiyiy_iP(Y)P(Y)P(Y)xixix_iP(X|Y)P(X|Y)P(X|Y) 更新: Ryabko論文で言及された2つの論文(hereとhere)は、ここで関連性があるようです。彼らは、が任意のプロセス(たとえば、iidではなく、おそらく非定常)からのものであると想定しています。彼らは、この場合、最近傍とカーネル推定量が一致していることを示しています。しかし、私はこの状況で確率的勾配降下に基づく推定が有効であるかどうかにもっと興味があります。xixix_i

1
なぜ私たちは自分の直感を確率で信頼できないのですか?
これが明らかになるケースがあったとしても、それはモンティホールの問題です。偉大なポール・エルドスでさえ、この問題にだまされました。答えるのが難しいかもしれない私の質問は、私たちが直感的な議論を理解し、それでもそれほど間違っている答えに自信を持つことができる確率については何ですか。1桁目のベンフォードの法則と待ち時間のパラドックスは、このような他の有名な例です。

1
Luce選択公理、条件付き確率についての質問[終了]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 2年前休業。 私はルース(1959)を読んでいます。それから私はこの声明を見つけました: 人が選択肢の中から選択すると、非常に多くの場合、それらの応答は、選択セットで条件付けられた確率によって管理されているように見えます。しかし、条件付き確率の標準的な定義を伴う通常の確率理論は、必要なものとはかなり思えません。例は難しさを示しています。自宅から別の都市への移動方法を決定する場合、飛行機(a)、バス(b)、または車(c)のいずれかを選択できます。旅行の形態に関連する自然の不確実な状態をA、B、Cで表すことにします。cを選択した場合、AとBのすべての不確実性が残ることに注意してください。ただし、aまたはbのいずれかを選択した場合、車はガレージに残り、セットCは車の運転時から大幅に変更されます。 第1章の選択公理は、固定された普遍的なサンプル空間の仮定をバイパスした確率のような選択理論を構築する最初の試みとして導入されました。 ソース:http://www.scholarpedia.org/article/Luce's_choice_axiom ΩΩ\OmegaFF\mathcal{F}PPP 上記の例に関して、私が定義した場合に問題になると思われるもの: Ω = { バス、車、飛行機}Ω={bus,car,airplane}\Omega = \{ \text{bus}, \text{car}, \text{airplane} \} 一般的な統計における重要な仮定の1つは、子宮口筋の状態です。これは、cpの仮定に違反しているため、選択動作のコンテキストで基本的な確率理論を調整する必要がある理由ですか?

5
条件付き確率-それらはベイジアン固有のものですか?
条件付き確率がベイジアン主義に固有のものであるのか、それとも統計学/確率論の人々の間でいくつかの学派の間で共有されているより一般的な概念であるのだろうか。 私はそうだと思います、私は誰もできないと思いますは一種の論理的であり、ベイジアンに対して警告しながら、常連は少なくとも理論的に同意するだろうと思います条件付き確率のためではなく、実際的な理由からさらに推論します。p (A 、B )= p (A | B )p (B )p(A,B)=p(A|B)p(B)p(A,B) = p(A|B)p(B)

3
条件付き遷移確率を持つマルコフモデル
まず、統計と数学に精通しているわけではないことを前もって認識させてください。危険を冒すのに十分な知識があると言う人もいます。:DI用語を正しく使用していない場合は、謝罪します。 システムがある状態から別の状態に遷移する確率をモデル化しようとしています。単純なマルコフモデルは良い出発点です。(状態のセット、初期状態の確率のセット、状態間の遷移確率のセット。) ただし、私がモデリングしているシステムは、それよりも複雑です。時間Tの状態に至る遷移確率は、T-1の状態以外の変数に確実に依存しています。たとえば、S1-> S2の遷移確率は、太陽が輝いている場合は40%ですが、雨が降っている場合はS1-> S2の確率は80%になります。 コメント投稿者の質問からの追加情報: 状態は観察可能です。 状態は5〜10のみです。 現在、調査したい共変量は約30ありますが、最終的なモデルは確かにこれよりも少なくなります。 一部の共変量は連続的であり、その他は離散的です。 3つの質問: 条件付き遷移確率をマルコフモデルに組み込むにはどうすればよいですか? または、私がこの問題に取り組む必要がある完全に別の視点がありますか? また、これについて詳しく知るためにオンラインで検索する必要があるキーワード/概念は何ですか? 私はすでに「条件付き遷移確率のあるマルコフモデル」のようなものを検索してきましたが、これまでのところ、私に直面したことはなく、「これはあなたの答えです、ダミーです!」 あなたの助けと忍耐をありがとう。

13
「BにAが与えられる可能性が高い」場合、「AにBが与えられる可能性が高い」
私は背後にあるより明確な直感を得ようとしています:「あAAがBBBより可能にするなら、BBBはあAAより可能にする」すなわち ましょn (S)n(S)n(S)する空間の大きさ示すあAA及びBBB、その後、あるを 主張:P(B | A )> P(B )P(B|A)>P(B)P(B|A)>P(B) so n (A B )/ n (A )> n (B )/ n (S)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A) > n(B)/n(S) so n (A B )/ n (B )> n (A )/ n (S)n(AB)/n(B)>n(A)/n(S)n(AB)/n(B) > n(A)/n(S) これはP(A | B )> P(A )P(A|B)>P(A)P(A|B)>P(A) 私は数学を理解していますが、なぜこれが直感的に理解できるのですか?

1
複数の期待を計算するときにドローを最適に分散する方法
期待値を計算したいとします。 EYEバツ| Y[ f(X、Y)]EYEX|Y[f(X,Y)]E_YE_{X|Y}[f(X,Y)] モンテカルロシミュレーションを使用してこれを近似したいとします。 EYEバツ| Y[ f(X、Y)] ≈ 1R SΣr = 1RΣs = 1Sf(xr 、s、yr)EYEX|Y[f(X,Y)]≈1RS∑r=1R∑s=1Sf(xr,s,yr)E_YE_{X|Y}[f(X,Y)] \approx \frac1{RS}\sum_{r=1}^R\sum_{s=1}^Sf(x^{r,s},y^r) しかし、両方の分布からサンプルを抽出するのはコストがかかるため、固定数のみを抽出する余裕があると想定します。 KKK どのようにを割り当てるべきですか?例には、各分布へのK / 2ドロー、または極端な場合、外側の1ドローと内側のK − 1ドロー、その逆などが含まれます。KKKK/ 2K/2K/2K− 1K−1K-1 私の直感は、それが互いに対する分布の分散/エントロピーと関係があるはずだと私に教えてくれます。外側の点が質点であるとすると、MCエラーを最小化するの除算は、Yの 1を描画し、XのK − 1を描画します。Y。 KKKYYYK−1K−1K-1X|YX|YX|Y うまくいけば、これは明確でした。

2
Distribution \ CLTの収束
その所与の、条件競合製品。です。は限界的な歪みがあります。Poisson()の場合、は正の定数です。N=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta 、それを示すよう、分布です。(Y − E (Y ))/ √θ→∞θ→∞\theta \rightarrow \infty (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 誰かがこれを解決するための戦略を提案できますか?CLT(Central Limit Theorem)を使用する必要があるようですが、に関する情報を独自に取得するのは難しいようです。サンプルを取り、を生成するために導入できるrvはありますか?YYYYYY これは宿題なのでヒントをいただければ幸いです。

1
LSAとpLSAの間の並列
pLSAの最初の論文では、著者のThomas Hoffmanが、pLSAとLSAのデータ構造の類似点を説明します。 バックグラウンド: 情報検索からインスピレーションを得て、ドキュメントのコレクション と用語の語彙NNND={d1,d2,....,dN}D={d1,d2,....,dN}D = \lbrace d_1, d_2, ...., d_N \rbraceMMMΩ={ω1,ω2,...,ωM}Ω={ω1,ω2,...,ωM}\Omega = \lbrace \omega_1, \omega_2, ..., \omega_M \rbrace コーパス で表すことができる cooccurencesのマトリックス。XXXN×MN×MN \times M 潜在的意味AnalisysによってSVD行列 3つの行列に因数分解される: ここでと特異値でありますとのランクである。XXXX=UΣVTX=UΣVTX = U \Sigma V^TΣ=diag{σ1,...,σs}Σ=diag{σ1,...,σs}\Sigma = diag \lbrace \sigma_1, ..., \sigma_s \rbraceσiσi\sigma_iXXXsssXXX 次に、図に示すように、のLSA近似が計算され、3つの行列がいくつかのレベルに切り捨てられます。X = U Σ ^ V T K < SXXX X^=U^Σ^VT^X^=U^Σ^VT^\hat{X} = …

1
観測されたイベントと期待されたイベントを比較する方法は?
4つの可能なイベントの頻度の1つのサンプルがあるとします。 Event1 - 5 E2 - 1 E3 - 0 E4 - 12 そして、私は自分のイベントの発生が予想される確率を持っています: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 4つのイベントの観測頻度の合計(18)を使用して、イベントの予想頻度を計算できますか? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 


3
完全分散の法則の証明の何が問題になっていますか?
総分散の法則によれば、 Var(X)=E(Var(X∣Y))+Var(E(X∣Y))Var⁡(X)=E⁡(Var⁡(X∣Y))+Var⁡(E⁡(X∣Y))\operatorname{Var}(X)=\operatorname{E}(\operatorname{Var}(X\mid Y)) + \operatorname{Var}(\operatorname{E}(X\mid Y)) それを証明しようとすると、私は書きます Var(X)=E(X−EX)2=E{E[(X−EX)2∣Y]}=E(Var(X∣Y))Var⁡(X)=E⁡(X−E⁡X)2=E⁡{E⁡[(X−E⁡X)2∣Y]}=E⁡(Var⁡(X∣Y)) \begin{equation} \begin{aligned} \operatorname{Var}(X) &= \operatorname{E}(X - \operatorname{E}X)^2 \\ &= \operatorname{E}\left\{\operatorname{E}\left[(X - \operatorname{E}X)^2\mid Y\right]\right\} \\ &= \operatorname{E}(\operatorname{Var}(X\mid Y)) \end{aligned} \end{equation} どうしたの?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.