タグ付けされた質問 「bernoulli-distribution」

ベルヌーイ分布は、単一の「成功」確率によってパラメーター化された離散分布です。二項分布の特殊なケースです。

2
ベルヌーイサンプリングの信頼区間
ベルヌーイ確率変数ランダムサンプルがありますで、はiidrvで、で、は不明なパラメーターです。X i P (X i = 1 )= p pX1...XNX1...XNX_1 ... X_NXiXiX_iP(Xi=1)=pP(Xi=1)=pP(X_i = 1) = pppp 明らかに、一つの推定値を見つけることができ:。P:= (X 1 + ⋯ + X N)/ Npppp^:=(X1+⋯+XN)/Np^:=(X1+⋯+XN)/N\hat{p}:=(X_1+\dots+X_N)/N 私の質問は、信頼区間をどのように構築できますか?ppp

6
2つの二項分布が互いに統計的に異なるかどうかをテストします
データには3つのグループがあり、それぞれに二項分布があります(つまり、各グループには成功または失敗の要素があります)。成功の予測確率はありませんが、真の成功率の近似として、それぞれの成功率にのみ頼ることができます。私はこの質問を見つけましたが、これは近いですが、このシナリオに正確に対処していないようです。 テストを簡略化するために、2つのグループがあるとしましょう(このベースケースから3つのグループを拡張できます)。 グループ1の試行: = 2455n1n1n_1 グループ2試験: = 2730n2n2n_2 グループ1の成功:k1k1k_1 = 1556 グループ2の成功:k2k2k_2 = 1671 予想される成功確率はありません。サンプルから知っていることだけです。したがって、2つのグループの成功率は次のとおりです。 グループ1の成功率:p1p1p_1 = 1556/2455 = 63.4% グループ2の成功率: p2p2p_2 = 1671/2730 = 61.2% 各サンプルの成功率はかなり近いです。しかし、私のサンプルサイズも非常に大きいです。二項分布のC​​DFを調べて、最初の分布との違いを確認すると(最初はヌルテストであると仮定します)、2番目の分布が達成される可能性は非常に小さくなります。 Excelの場合: 1-BINOM.DIST(1556,2455,61.2%、TRUE)= 0.012 ただし、これは最初の結果の分散を考慮せず、最初の結果がテスト確率であると見なします。 これらの2つのデータサンプルが実際に互いに統計的に異なるかどうかをテストするより良い方法はありますか?

2
ロジスティック回帰:ベルヌーイ対二項応答変数
次の二項応答と、予測子としてとを使用してロジスティック回帰を実行します。 X1X1X_1X2X2X_2 次の形式でベルヌーイ応答と同じデータを提示できます。 これら2つのデータセットのロジスティック回帰出力はほとんど同じです。逸脱残差とAICは異なります。(ヌル偏差と残留偏差の差は、両方の場合で同じです-0.228。) 以下は、Rからの回帰出力です。データセットはbinom.dataおよびbern.dataと呼ばれます。 これが二項出力です。 Call: glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2, family = binomial, data = binom.data) Deviance Residuals: [1] 0 0 0 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.9649 21.6072 -0.137 0.891 X1Yes -0.1897 2.5290 -0.075 0.940 X2 0.3596 1.9094 0.188 …

4
ロジスティック回帰-エラー期間とその分布
ロジスティック回帰(およびその想定される分布)にエラー用語が存在するかどうかについて、さまざまな場所で次のことを読みました。 エラー用語は存在しません エラー項には二項分布があります(応答変数の分布に従って) エラー項にはロジスティック分布があります 誰かが明確にできますか?

3
Kはベルヌーイ試験で成功、またはジョージルーカスの映画実験
私は今「酔っぱらいの散歩」を読んでいて、そこから一つの物語を理解できません。 ここに行く: ジョージルーカスが新しいスターウォーズ映画を製作し、あるテストマーケットでクレイジーな実験を行うことに決めたと想像してください。彼は「スターウォーズ:エピソードA」と「スターウォーズ:エピソードB」という2つのタイトルで同一の映画をリリースしています。各映画には独自のマーケティングキャンペーンと配給スケジュールがあり、対応する詳細は同一です。ただし、一方の映画の予告編と広告は「エピソードA」、もう一方の映画のエピソードは「エピソードB」です。 今、私たちはそれからコンテストを作ります。どの映画がより人気がありますか?最初の20,000人の映画ファンを見て、彼らが選んだ映画を録画したとしましょう(両方に行って、両者の間に微妙ではあるが意味のある違いがあると主張する頑固なファンを無視します)。映画とそのマーケティングキャンペーンは同一なので、この方法でゲームを数学的にモデル化できます。すべての視聴者を一列に並べ、各視聴者のコインを順番に反転させることを想像してください。コインが着地した場合、彼または彼女はエピソードAを見ます。コインが着地した場合、エピソードBになります。コインはどちらの方法でも同じ確率で出現するため、この実験的な興行戦争では、各映画が約半分の時間でリードしていると考えるかもしれません。 しかし、ランダム性の数学は別の言い方をします:リードの変化の最も可能性の高い数は0であり、2つの映画の1つが20,000人の顧客すべてをリードする可能性は、リードが継続的にシーソーするよりも88倍高い」 私は、おそらく間違って、これを単純なベルヌーイ裁判の問題に起因するものであり、リーダーが平均してシーソーを行わない理由がわからないと言わなければなりません!誰でも説明できますか?

2
パラメータ推定のために二項分布の尤度関数を導出する方法は?
Miller and Freund's Probability and Statistics for Engineers、8ed(pp.217-218)によれば、二項分布(ベルヌーイ試行)で最大化される尤度関数は次のように与えられます。 L (p )= ∏ni = 1pバツ私(1 − p )1 - x私L(p)=∏私=1npバツ私(1−p)1−バツ私L(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} この方程式に到達する方法は?他の分布であるポアソンとガウス分布に関しては、私にはかなり明らかなようです。 L (θ )= ∏ni = 1distのPDFまたはPMF。L(θ)=∏私=1ndistのPDFまたはPMF。L(\theta) = \prod_{i=1}^n \text{PDF or PMF of dist.} しかし、二項式のものは少し異なります。率直に言うと、どのように n Cバツ pバツ(1 − p )n − xnCバツ pバツ(1−p)n−バツnC_x~p^x(1-p)^{n-x} なる pバツ私(1 − p )1 …

1
相関二項確率変数の生成
線形変換アプローチに従って相関ランダム二項変数を生成できるかどうか疑問に思っていましたか? 以下では、Rで簡単なものを試してみました。しかし、私はこれを行うための原則的な方法があるかどうか疑問に思っていましたか? X1 = rbinom(1e4, 6, .5) ; X2 = rbinom(1e4, 6, .5) ; X3 = rbinom(1e4, 6, .5) ; a = .5 Y1 = X1 + (a*X2) ; Y2 = X2 + (a*X3) ## Y1 and Y2 are supposed to be correlated cor(Y1, Y2)


2
2つの独立したベルヌーイ母集団からのサンプリング分布
2つの独立したベルヌーイ確率変数のサンプル、およびます。Ber(θ1)Ber(θ1)\mathrm{Ber}(\theta_1)Ber(θ2)Ber(θ2)\mathrm{Ber}(\theta_2) どうやっていることを証明しない?(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1) と仮定します。n1≠n2n1≠n2n_1\neq n_2

3
10回の失敗までサンプリングすることにより、ベルヌーイプロセスの確率を推定する:偏っているか?
故障確率(たとえば)のベルヌーイプロセスがあり、そこから故障が発生するまでサンプリングするとします。これにより、失敗の確率をとして推定します。ここで、はサンプル数です。Q ≤ 0.01 10 Q:= 10 / N Nqqqq≤0.01q≤0.01q \leq 0.01101010q^:=10/Nq^:=10/N\hat{q}:=10/NNNN 質問:ある偏った推定の?そして、もしそうなら、それを修正する方法はありますか?q^q^\hat{q}qqq 私は、最後のサンプルが推定に失敗するバイアスであると主張しています。

2
相関ベルヌーイ試験、多変量ベルヌーイ分布?
私は仕事で持っている研究の質問を簡素化しています。私が5枚のコインを持っていると想像して、ヘッドを成功と呼びましょう。これらは成功確率p = 0.1の非常に偏ったコインです。コインが独立している場合、少なくとも1ヘッド以上の確率を取得するのは非常に簡単で、です。私のシナリオでは、私のベルヌーイ試験(コイントス)は独立していません。私がアクセスできる唯一の情報は、成功の確率(それぞれがp = .1です)と、バイナリ変数間の理論的なピアソン相関です。1−(1−1/10)51−(1−1/10)51-(1-1/10)^5 この情報だけで1つ以上の成功の確率を計算する方法はありますか?これらの理論的な結果はシミュレーション研究の精度を導くために使用されるため、シミュレーションベースのアプローチを避けようとしています。多変量ベルヌーイ分布を調べてきましたが、相関と成功の限界確率でのみ完全に指定できるとは思いません。私の友人は、ベルヌーイ辺縁でガウスコピュラを構築することを推奨し(Rパッケージを使用copula)pMvdc()、大きなサンプルで関数を使用して希望する確率を取得しましたが、どうやってそれを実行するのか正確にはわかりません。

2
ファイ、マシューズ、ピアソンの相関係数の関係
ファイとマシューズの相関係数は同じ概念ですか?2つのバイナリ変数のピアソン相関係数とどのように関連または同等ですか?バイナリ値は0と1であると仮定します。 2つのベルヌーイ確率変数xxxと間のピアソンの相関yyyは次のとおりです。 ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]−−−−−−−−−−√=E[xy]−E[x]E[y]Var[x]Var[y]−−−−−−−−−−√=n11n−n1∙n∙1n0∙n1∙n∙0n∙1−−−−−−−−−−√ρ=E[(x−E[x])(y−E[y])]Var[x]Var[y]=E[xy]−E[x]E[y]Var[x]Var[y]=n11n−n1∙n∙1n0∙n1∙n∙0n∙1 \rho = \frac{\mathbb{E} [(x - \mathbb{E}[x])(y - \mathbb{E}[y])]} {\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{\mathbb{E} [xy] - \mathbb{E}[x] \, \mathbb{E}[y]}{\sqrt{\text{Var}[x] \, \text{Var}[y]}} = \frac{n_{1 1} n - n_{1\bullet} n_{\bullet 1}}{\sqrt{n_{0\bullet}n_{1\bullet} n_{\bullet 0}n_{\bullet 1}}} どこ E[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11nE[x]=n1∙nVar[x]=n0∙n1∙n2E[y]=n∙1nVar[y]=n∙0n∙1n2E[xy]=n11n \mathbb{E}[x] = \frac{n_{1\bullet}}{n} \quad \text{Var}[x] = \frac{n_{0\bullet}n_{1\bullet}}{n^2} \quad \mathbb{E}[y] = \frac{n_{\bullet 1}}{n} \quad \text{Var}[y] …

3
ベルヌーイ試験で「成功」の確率を推定するために必要なサンプルサイズ
ゲームが、完了時に報酬を与えるか、何も与えないイベントを提供するとします。報酬が与えられるかどうかを決定する正確なメカニズムは不明ですが、乱数ジェネレーターが使用されていると想定しています。結果がハードコードされた値よりも大きい場合は、報酬が得られます。 報酬が与えられる頻度を決定するためにプログラマーが使用した値(推定15-30%)を基本的にリバースエンジニアリングする場合、必要なサンプル数をどのように計算しますか? 私はここの「真の確率の推定」セクションから始めました:Checking_whether_a_coin_is_fair、しかし私が正しい道を進んでいるかどうか確信がありません。95%の信頼度で最大3%のエラーが発生するために必要な〜1000サンプルの結果が得られました。 最終的に、私が解決しようとしているのは次のとおりです。 イベント#1は1.0Rの報酬を与え、時間のX% イベント#2は、時間のY%で報酬1.4Rを提供します XとYを正確に見積もり、どのイベントがより効率的かを判断したいと思います。最大で20分ごとに1つのサンプルしか取得できないため、サンプルサイズが大きいと問題になります。

2
経験的分布の代替
賞金: 完全な恵みを推定言及用途または任意の発表された論文への参照を提供誰かに授与されますF~F~\tilde{F}以下を。 動機: このセクションはおそらくあなたにとって重要ではなく、あなたが報奨金を得るのに役立たないと思いますが、誰かが動機について尋ねたので、ここで私が取り組んでいるものがあります。 統計グラフ理論の問題に取り組んでいます。標準の密集グラフ制限オブジェクトW:[0,1]2→[0,1]W:[0,1]2→[0,1]W : [0,1]^2 \to [0,1]の意味での対称関数であるW(u,v)=W(v,u)W(u,v)=W(v,u)W(u,v) = W(v,u)。上のグラフサンプリングnnn頂点がサンプリングと考えることができるnnn(単位区間上に均一な値UiUiU_iためにi=1,…,ni=1,…,ni = 1, \dots, n)、次いで、エッジの確率(i,j)(i,j)(i,j)であるW(Ui,Uj)W(Ui,Uj)W(U_i, U_j)。結果の隣接行列をAと呼びますAAAます。 我々は扱うことができWWW密度としてf=W/∬Wf=W/∬Wf = W / \iint Wと仮定∬W&gt;0∬W&gt;0\iint W > 0。我々は推定した場合fffに基づいてAAAへの制約を受けることなくfff、我々は一貫性の推定値を得ることができません。fが制約付きの可能な関数のセットに由来する場合、一貫して推定することに関する興味深い結果を見つけました。この推定量と∑ Aから、Wを推定できます。ffffff∑A∑A\sum AWWW 残念ながら、私が見つけた方法は、密度分布からサンプリングしたときに一貫性を示していfffます。AAA構築方法では、ポイントのグリッドをサンプリングする必要があります(元のから描画するのとは対照的fffです)。このstats.SEの質問では、実際に分布から直接サンプリングするのではなく、このようなグリッドでサンプルベルヌーイのみをサンプリングできる場合に何が起こるかという1次元(より単純な)問題を求めています。 グラフの制限の参照: L.ロバスツとB.セゲディ。密なグラフシーケンスの制限(arxiv)。 C.ボルグス、J。チェイス、L。ロバスツ、V。ソス、K。ヴェステルゴンビ。密なグラフの収束シーケンスi:サブグラフの頻度、メトリックプロパティ、およびテスト。(arxiv)。 表記: CDFと連続分布検討FFFおよびPDF fff区間に正サポートしている[0,1][0,1][0,1]。仮定fffないpointmassを有していない、FFFどこでも微分可能であり、また、そのsupz∈[0,1]f(z)=c&lt;∞supz∈[0,1]f(z)=c&lt;∞\sup_{z \in [0,1]} f(z) = c < \inftyのsupremumあるfff区間に[0,1][0,1][0,1]。ましょXX∼FX∼FX \sim F確率変数という意味XXXは、分布からサンプリングされFFFます。 UiUiU_iオンIID一様ランダム変数である[0,1][0,1][0,1]。 問題のセットアップ: 多くの場合、X1,…,XnX1,…,XnX_1, \dots, X_nを分布ランダム変数とFFFし、通常の経験分布関数として F N(T …


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.