タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
マルコフ、チェビシェフの不等式が厳しいランダム変数
マルコフまたはチェビシェフの不等式が厳しい確率変数の作成に興味があります。 簡単な例は、次の確率変数です。 P (| X | ≥ 1 )= 1P(X=1)=P(X=−1)=0.5P(X=1)=P(X=−1)=0.5P(X=1)=P(X=-1) = 0.5。その平均はゼロであり、分散は1であり、です。このランダム変数の場合、チェビシェフはタイトです(等しい値で保持されます)。P(|X|≥1)=1P(|X|≥1)=1P(|X| \ge 1) = 1 P(|X|≥1)≤Var(X)12=1P(|X|≥1)≤Var(X)12=1P(|X|\ge 1) \le \frac{\text{Var}(X)}{1^2} = 1 マルコフとチェビシェフがタイトである、より興味深い(非一様)確率変数はありますか?いくつかの例は素晴らしいでしょう。

6
確率論、測度論、そして最後に機械学習について学びたいです。どこから始めますか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 3年前休業。 確率論、測度論、そして最後に機械学習について学びたいです。私の最終的な目標は、ソフトウェアで機械学習を使用することです。 私は大学で微積分と非常に基本的な確率を勉強しましたが、それだけです。これらの科目について学ぶために使用できるオンラインコースや書籍を知っていますか。私はウェブ上で多くのリソースを見つけましたが、それらはすべて専門家の読者を対象にしているようです。時間がかかることはわかっていますが、最初から学びたい場合はどこから始めればよいですか。

2
クリケットボウラーをモデル化して打者を出す
多数のクリケットゲーム(数千)の詳細を示すデータセットがあります。クリケットでは、「ボウラー」が「打者」の連続で繰り返しボールを投げます。ボウラーは打者を「出」しようとしています。この点で、野球の投手や打者とよく似ています。 データセット全体を取り、打者を獲得したボールの総数をボーリングされたボールの総数で割ると、ボウラーが打者を獲得する平均確率が得られることがわかります-約0.03(うまくいけば、私はすでに間違っていませんか?) 私が興味を持っているのは、特定の打者が次のボールで特定のボウラーによってボウリングされる確率を計算してみることです。 データセットは、特定のボウラーが数千のボールをさまざまなバットマンにボーリングするのに十分な大きさです。したがって、ボウラーが達成したアウトの数をボーリングしたボールの数で単純に除算して、その特定のボウラーが次のボールからアウトを獲得する新しい確率を計算できると思います。 私の問題は、特定のボウラーが特定の打者で統計的に有意な数のボールをボウリングしたことを保証するのに十分な大きさのデータセットではないことです。したがって、特定の打者に直面している特定のボウラーのアウトの確率を計算することに興味がある場合、これは同じ単純な方法で行うことはできないと思います。 私の質問は、次のアプローチが有効かどうかです: データセット全体で、ボールがアウトになる確率は0.03です。 私が平均してボウラーAが0.06(つまり、平均ボウラーの2倍の確率)から出る確率を計算すると、 そして、平均して、打者Bは0.01(平均的な打者と同じくらいの確率で3分の1)から外れる確率を持っていました、 その特定の打者がその特定のボウラーの次のボールに出る確率が0.06 *(0.01 / 0.03)= 0.02になると言うのは有効ですか?

1
二次形式の法線の分布
の分布を把握しようとしています ここで、、にとると、 および (*)の分布については不明です(n−1)∑i=1nZ2i−(∑i=1nZi)2(∗)(n−1)∑i=1nZi2−(∑i=1nZi)2(∗) (n-1) \sum_{i=1}^n Z_i^2 - \left( \sum_{i=1}^n Z_i \right)^2 \qquad (*) Zi∼N(0,1)Zi∼N(0,1)Z_i \sim \mathcal{N}(0,1)∑i=1nZ2i∼χ2(n)∑i=1nZi2∼χ2(n) \sum_{i=1}^n Z_i^2 \sim \chi^2(n) 1n(∑i=1nZi)2∼χ2(1).1n(∑i=1nZi)2∼χ2(1). \frac{1}{n}\left( \sum_{i=1}^n Z_i \right)^2 \sim \chi^2(1).


3
バイアスされたコインを使用して、ベルヌーイ変数を確率シミュレートします
誰かがどのようにシミュレートするために、私に教えてもらえます、(あなたが必要な回数だけ)コインを使用しては、投げると?、B∈NP(H)=PBernoulli(ab)Bernoulli(ab)\mathrm{Bernoulli}\left({a\over b}\right)a,b∈Na,b∈Na,b\in \mathbb{N}P(H)=pP(H)=pP(H)=p 拒否のサンプリングを使用することを考えていましたが、それを明確にすることはできませんでした。

1
ランダムに重複する間隔
次の問題で分析式を見つけるにはどうすればよいですか?D(n,l,L)D(n,l,L)D(n,l,L) 長さ「バー」を間隔にランダムにドロップします。「バー」はオーバーラップできます。少なくとも1つの「バー」が占める間隔の平均全長を見つけたいのですが。l [ 0 、L ] D [ 0 、L ]nnnlll[0,L][0,L][0,L]DDD[0,L][0,L][0,L] 「低密度」の制限では、オーバーラップは無視でき、です。「高密度」の限界では、は近づきます。しかし、どうすれば一般式を取得できますか?これは非常に基本的な統計上の問題になるはずですが、フォーラムで説明的な解決策を見つけることができませんでした。D L DD=n⋅lD=n⋅lD = n\cdot lDDDLLLDDD どんな助けでも大歓迎です。 バーは互いにランダムに(統計的に独立して)ドロップされることに注意してください。

1
ダイにはいくつの面がありますか?JAGSのベイズ推定
問題 辺の数が不明で死ぬのに類似したシステムについて、いくつかの推論をしたいと思います。サイコロを数回振り、その後、サイコロの側面の数θに対応するパラメーターの確率分布を推測します。 直感 40回ロールした後、10個の赤、10個の青、10個の緑、10個の黄を観察した場合、θは4でピークになり、各側のロールのバイアスは1/4を中心とした分布になります。 θには自明な下限があり、これはデータで観測されたさまざまな辺の数です。 上限はまだ不明です。おそらくバイアスが低い5番目のサイドが存在する可能性があります。5番目のカテゴリがないことを示すデータが多いほど、θ= 4の事後確率が高くなります。 アプローチ ここでは適切と思われる同様の問題(Rおよびrjagsを介して)にJAGSを使用しました。 データに関してobs <- c(10, 10, 10, 10)、上の例の観測に対応するとします。 私は観測が多項分布でモデル化されるべきだと思うobs ~ dmulti(p, n)、p ~ ddirch(alpha)とn <- length(obs)。 θはによって暗示されるカテゴリの数にリンクされているalphaのでalpha、さまざまな数のカテゴリを含むようにモデル化するにはどうすればよいですか? 代替案? 私はベイジアン分析にかなり新しいので、間違ったツリーを完全に見つけ出すかもしれませんが、この問題について異なる洞察を提供するかもしれない代替モデルはありますか? どうもありがとう!デビッド

4
urnの確率分布は、平均して置換せずにそこから引き出すと変化しますか?
urnにN個の異なる色のボールが含まれていて、それぞれの色が異なる回数表示される可能性があるとします(10個の赤いボールがある場合、10個の青いボールも必要ありません)。描画する前に骨壷の正確な内容がわかっている場合は、ボールの各色を描画する確率を示す離散確率分布を形成できます。私が平均的に骨壷から交換せずにk個のボールを描いた後に分布がどのように変化するのか私が思っているのは。骨壷から引き出したときに、何が取り出されたかという知識で分布を更新できることを理解していますが、知りたいのは、k個のボールを削除した後の分布の形状がどのようになると予想されるかです。分布は平均的に変化しますか、それとも同じままですか?それが変わらない場合、k回のドローを行った後、新しい分布が平均的にどのように見えると期待できるかについて、いくつかの式を書き留めることができますか?

1
2つの吸収マルコフチェーンがある場合、一方が他方より先に終了する確率はどれくらいですか?
2つの異なるマルコフチェーンがあり、それぞれに1つの吸収状態と既知の開始位置があります。チェーン1がチェーン2よりも少ないステップで吸収状態に達する確率を決定したいと思います。 特定のチェーンでnステップ後に吸収状態に達する確率を計算できると思います。遷移行列与えられた場合、nステップ後に吸収される確率はP n i jです。ここで、iは開始状態、jは吸収状態です。 。PPPんnnPん私はjPijnP^n_{ij}私iijjj ここからどこへ行くかは定かではありません。私が見た類似の問題にはサイコロが含まれます(たとえば、合計が8の前に合計が7になる)が、特定の合計を振る確率は一定であり、これまでのステップ数とは無関係であるため、簡単に解決できます。

1
X、YはN(0,1)からのidです。X> 2Yである確率はどれくらいですか
以来、私は、考えていたからあるN (0 、1 )、その後、彼らは独立していますX,YX,YX, YN(0,1)N(0,1)N(0,1) 分布有し N (0 、5 )。次いで、 X - 2 Y > 0の確率有する 1 / 2。X−2YX−2YX - 2YN(0,5)N(0,5)N(0, 5)X−2Y>0X−2Y>0X-2Y > 01/21/21/2 上記のことは、その後のように思えるが、私には正しいようだ 確率だろう1 / 2。それは少し間違っているようです。何か問題がありましたか?X>nYX>nYX>nY1/21/21/2


1
連続してボールを選択してマークすることにより、ボールの数を推定する
バッグにN個のボールがあるとします。最初のドローで、ボールにマークを付けてバッグに戻します。2回目の抽選で、マークされたボールを手に取ったら、バッグに戻します。ただし、マークの付いていないボールを拾った場合は、マークを付けてバッグに戻します。私はこれを何度も引き続けます。ドローの数とマークされた/マークされていないドローの履歴が与えられた場合、バッグ内の予想ボール数はいくつですか?

1
確率変数の関数の確率分布?
疑問があります:確率空間定義された実数値確率変数と考えてみてください。XXXZZZ(Ω,F,P)(Ω,F,P)(\Omega, \mathcal{F},\mathbb{P}) ましょう、実数値関数です。以来確率変数の関数であり、それは確率変数です。Y:=g(X,Z)Y:=g(X,Z)Y:= g(X,Z)g(⋅)g(⋅)g(\cdot)YYY してみましょうすなわちの実現。x:=X(ω)x:=X(ω)x:=X(\omega)XXX ある等しい?P(Y|X=x)=P(g(X,Z)|X=x)P(Y|X=x)=P(g(X,Z)|X=x)\mathbb{P}(Y|X=x)=\mathbb{P}(g(X,Z)|X=x)P(g(x,Z))P(g(x,Z))\mathbb{P}(g(x,Z))

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.