タグ付けされた質問 「bernoulli-distribution」

ベルヌーイ分布は、単一の「成功」確率によってパラメーター化された離散分布です。二項分布の特殊なケースです。

2
過剰パラメーター化モデルのフィッシャー情報行列行列式
ベルヌーイ確率変数の検討X∈{0,1}X∈{0,1}X\in\{0,1\}パラメータとθθ\theta(成功の確率)。尤度関数とフィッシャー情報(1×11×11 \times 1行列)は次のとおりです。 L1(θ;X)I1(θ)=p(X|θ)=θX(1−θ)1−X=detI1(θ)=1θ(1−θ)L1(θ;X)=p(X|θ)=θX(1−θ)1−XI1(θ)=detI1(θ)=1θ(1−θ) \begin{align} \mathcal{L}_1(\theta;X) &= p(\left.X\right|\theta) = \theta^{X}(1-\theta)^{1-X} \\ \mathcal{I}_1(\theta) &= \det \mathcal{I}_1(\theta) = \frac{1}{\theta(1-\theta)} \end{align} 成功の確率:今、二つのパラメータを持つ「オーバー・パラメータ」バージョンを検討と失敗の確率。(であり、この制約はパラメーターの1つが冗長であることを意味します。)この場合、尤度関数とフィッシャー情報行列(FIM)は次のとおりです。θ1θ1\theta_1θ0θ0\theta_0θ1+θ0=1θ1+θ0=1\theta_1+\theta_0=1 L2(θ1,θ0;X)I2(θ1,θ0)detI2(θ)=p(X|θ1,θ0)=θX1θ1−X0=(1θ1001θ0)=1θ1θ0=1θ1(1−θ1)L2(θ1,θ0;X)=p(X|θ1,θ0)=θ1Xθ01−XI2(θ1,θ0)=(1θ1001θ0)detI2(θ)=1θ1θ0=1θ1(1−θ1) \begin{align} \mathcal{L}_2(\theta_1,\theta_0;X) &= p(\left.X\right|\theta_1,\theta_0) = \theta_1^{X}\theta_0^{1-X} \\ \mathcal{I}_2(\theta_1,\theta_0) &= \left( \begin{matrix} \frac{1}{\theta_1} & 0 \\ 0 & \frac{1}{\theta_0} \end{matrix} \right) \\ \det \mathcal{I}_2(\theta) &= \frac{1}{\theta_1 \theta_0} = \frac{1}{\theta_1 (1-\theta_1)} \end{align} …

1
コインが公正かどうかの確認
友人から次の質問をされました。私は彼女を助けることができませんでしたが、誰かがそれを私に説明してくれることを願っています。同様の例は見つかりませんでした。ヘルプと説明をありがとうございます。 Q:100コイントス実験の結果が0 = "Tail"および1 = "Head"として記録されます。出力xは、0と長さ100の1の文字列です。xで1-0-0を取得する回数が計算され、20になります(例:if x =(001001110100)、1-0-0 2回発生します)。これは公正なコインだと思いますか?

1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
コックスハザードモデルの生存曲線を解釈するにはどうすればよいですか?
コックス比例ハザードモデルから生存曲線をどのように解釈しますか? このおもちゃの例ではage、kidneyデータの変数にcox比例ハザードモデルがあり、生存曲線を生成するとします。 library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() たとえば、時間、どのステートメントが正しいですか?または両方が間違っていますか?200200200 ステートメント1:被験者は20%残ります(たとえば、人がいる場合、200日目までに、およそ200人が残っているはずです)。 100010001000200200200200200200 ステートメント2:特定の人に対して、彼/彼女は200日目に生存する可能性がます。20%20%20\%200200200 βTxβTx\beta^Tx

3
バイアスされたコインを使用して、ベルヌーイ変数を確率シミュレートします
誰かがどのようにシミュレートするために、私に教えてもらえます、(あなたが必要な回数だけ)コインを使用しては、投げると?、B∈NP(H)=PBernoulli(ab)Bernoulli(ab)\mathrm{Bernoulli}\left({a\over b}\right)a,b∈Na,b∈Na,b\in \mathbb{N}P(H)=pP(H)=pP(H)=p 拒否のサンプリングを使用することを考えていましたが、それを明確にすることはできませんでした。

3
Rademacher確率変数の積の合計
してみましょう値取って独立な確率変数であるまたは確率0.5それぞれで。合計ます。確率を上限にしたいと思います。私が今持っている最高の境界はで、cは普遍定数です。これは、単純なチャーノフ境界を適用することにより、確率Pr(| x_1 + \ dots + x_n | &lt;\ sqrt {t})およびPr(| y_1 + \ dots + y_n | &lt;\ sqrt {t})の下限を設定することで実現されます。この限界よりもはるかに優れたものを手に入れたいと思いますか?まず第一に、私は少なくとも得ることができますx1…xa,y1…ybx1…xa,y1…ybx_1 \ldots x_a,y_1 \ldots y_b+1+1+1−1−1-1S=∑i,jxi×yjS=∑i,jxi×yjS = \sum_{i,j} x_i\times y_jP(|S|&gt;t)P(|S|&gt;t)P(|S| > t)2e−ctmax(a,b)2e−ctmax(a,b)2e^{-\frac{ct}{\max(a,b)}}cccPr(|x1+⋯+xn|&lt;t√)Pr(|x1+⋯+xn|&lt;t)Pr(|x_1 + \dots + x_n|<\sqrt{t})Pr(|y1+⋯+yn|&lt;t√)Pr(|y1+⋯+yn|&lt;t)Pr(|y_1 + \dots + y_n|<\sqrt{t})e−ctab√e−ctabe^{-c\frac{t}{\sqrt{ab}}}。サブガウステールを取得できる場合、おそらくそれが最善ですが、それは期待できますか(そうは思わないが、引数について考えることはできません)。

2
コインが他のコインよりも優れている確率はどれくらいですか?
2つのバイアスされたコインがC1あり、C2どちらも頭を向ける確率が異なるとします。 私たちはC1 n1時間を投げてH1頭を出し、C2 n2時間をかけてH2頭を出します。そして、1つのコインの表の比率が他のコインよりも高いことがわかります。 あるコインが他のコインよりも優れていると言える確率はどのくらいですか?(ここでの方が良いということは、実際に頭を回す可能性が高いということです)

3
ベルヌーイ分布のは何ですか?
確率のベイズ理論では、確率はあるものについての知識の表現であり、そのものの特性ではありません。しかし、私は常に人々がを推定する必要があるパラメータとして扱うのを見ています。彼らは、事前分布を、通常はベータ関数の形式で設定し、この変数の「実現」に応じて更新します。pppppp 偉大なベイジアンのジェインズでさえ、「確率を推定している」、または「データに最も適合する」を探しているという印象を与えることがあります。ppp ここで、「ベルヌーイクラス」に属する仮説のみを考慮に入れます。この場合、各試行で可能な結果があり、実験の連続反復でのの確率は独立して定常的であると見なされます。BmBmB_mmmmAkAkA_k 確率論、ET Jaynes、297ページ これは、私は混乱になりある確率ではない、それは確率変数の財産であり、それはであることから、周波数いない変数は、単一のイベントを表しているので、。ppp

1
ベルヌーイを証明することはベータの限界です
それは私たちが解決した場合、その検査によって私には明らかだ(それによって、平均固定)としましょう(、ベータ分布はベルヌーイに近づく)配布。β=1−μμαβ=1−μμα\beta = \frac{1-\mu}{\mu} \alphaα→0α→0\alpha \rightarrow 0μμ\mu 例えば: par(mfrow = c(1, 2), oma = c(0, 0, 1.5, 0)) xx = seq(0, 1, length.out = 1000) mus = c(.2, .7) for (ii in 1:2) { mu = mus[ii] matplot(xx, sapply(10^(-1:-5), function(al) pbeta(xx, al, (1-mu)/mu * al)), type = 'l', lty = ii, …

1
場合はベルヌーイ試験の信頼区間を取得するにはどのように?
ベルヌーイCIの標準式は次のとおりです。 p^±z1 - α / 2p^(1 −p^)ん−−−−−−−−√p^±z1−α/2p^(1−p^)ん\hat{p}\pm z_{1-\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} もしどのように信頼区間を推定しないとき小さいとなる?この場合、上記の方程式はに縮小され。これは、を大きくしても信頼区間が改善されないことを意味します。p^=メートルんp^=メートルん\hat{p} = \frac{m}{n} ん ん\ n m = 0 メートル=0\ m = 0 0 ± 0 0±0\ 0 \pm 0 ん ん\ n 私の考えでは、が0のままであることを考えると、CIは[0,1]から始まり、が増加するにつれて上限が減少するはずです。 ん ん\ n メートル メートル\ m

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.