タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

3
二変量二項分布を可視化する
質問: 3次元空間では2変量2項分布はどのように見えますか? 以下は、パラメーターのさまざまな値について視覚化したい特定の関数です。つまり、、p 1、およびp 2です。nnnp1p1p_{1}p2p2p_{2} f(x1,x2)=n!x1!x2!px11px22,x1+x2=n,p1+p2=1.f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.f(x_{1},x_{2}) = \frac{n!}{x_{1}!x_{2}!}p_{1}^{x_{1}}p_{2}^{x_{2}}, \qquad x_{1}+x_{2}=n, \quad p_{1}+p_{2}=1. 2つの制約があることに注意してください。およびp 1 + p 2 = 1です。さらに、nは正の整数、たとえば5です。x1+x2=nx1+x2=nx_{1}+x_{2}=np1+p2=1p1+p2=1p_{1}+p_{2}=1nnn555 LaTeX(TikZ / PGFPLOTS)を使用して関数をプロットする試みが2回行われました。そうすることで、、p 1 = 0.1とp 2 = 0.9、およびn = 5、p 1 = 0.4とp 2 = 0.6の値について、以下のグラフを取得します。ドメイン値に制約を実装することに成功していません。x 1 + x 2 = nなので、少し困惑しています。n=5n=5n=5p1=0.1p1=0.1p_{1}=0.1p2=0.9p2=0.9p_{2}=0.9n=5n=5n=5p1=0.4p1=0.4p_{1}=0.4p2=0.6p2=0.6p_{2}=0.6x1+x2=nx1+x2=nx_{1}+x_{2}=n 任意の言語(R、MATLABなど)で作成された視覚化は問題ありませんが、私はTikZ / PGFPLOTSを使用してLaTeXで作業しています。 最初の試み 、 p 1 = …

2
PythonでのQQプロット
次のコードを使用してqqプロットを生成しました。qqプロットは、データが正常に分布しているかどうかを確認するために使用されることを知っています。私の質問は、x軸とy軸のラベルがqqプロットで何を示し、そのr二乗値が何を示しているかです。 N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() すでにqq plotについての議論があることは知っていますが、その議論を経験したにもかかわらず、の概念を理解できませんでした。


1
非相関性が独立性を意味するのはどの分布ですか?
古くからある統計では、「無相関は独立を意味するものではありません」としています。通常、このリマインダーは、「2つの変数が一緒に正規分布しているにもかかわらず、無相関が独立性を暗示している」という心理的に心地よい(そして科学的に正しい)ステートメントで補足されます。 幸せな例外の数を1から2に増やすことができます。2つの変数がベルヌーイ分布である場合、再び、無相関は独立性を意味します。場合とYは 2 Bermoulli RVの、あるX 〜B (q個のX)、XXXYYY、我々が持っているため、 P (X = 1 )= E (X )= Q 、X、および同様のための Y、それらの共分散でありますX∼B(qx),Y∼B(qy)X∼B(qx),Y∼B(qy)X \sim B(q_x),\; Y \sim B(q_y)P(X=1)=E(X)=qxP(X=1)=E(X)=qxP(X=1) = E(X) = q_xYYY Cov(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqyCov⁡(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqy\operatorname{Cov}(X,Y)= E(XY) - E(X)E(Y) = \sum_{S_{XY}}p(x,y)xy - q_xq_y =P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy=P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy = P(X=1,Y=1) - q_xq_y = P(X=1\mid Y=1)P(Y=1)-q_xq_y =(P(X=1∣Y=1)−qx)qy=(P(X=1∣Y=1)−qx)qy= \Big(P(X=1\mid Y=1)-q_x\Big)q_y 無相関のために、共分散がゼロである必要があります。 Cov(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)Cov⁡(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)\operatorname{Cov}(X,Y) = 0 …

5
連続確率変数が固定小数点をとる確率
私は、連続確率変数の確率密度関数は次のように定義された入門統計クラスにいる。私は理解しているの積分∫ F (X )D 、X = 0P{X∈B}=∫Bf(x)dxP{X∈B}=∫Bf(x)dxP\left\{X\in B\right\}=\int_B f\left(x\right)dx∫aaf(x)dx=0∫aaf(x)dx=0\int\limits_a^af(x)dx=0しかし、これは連続確率変数の直感では修正できません。Xとは、列車が到着する時刻tからの分数に等しい確率変数です。電車が今からちょうど5分後に到着する確率を計算するにはどうすればよいですか?この確率をゼロにするにはどうすればよいですか?それは不可能ですか?列車が今からちょうど5分後に到着した場合、確率0の場合にどうなるでしょうか。 ありがとう。

5
信頼区間と確率-このステートメントのエラーはどこにありますか?
誰かが以下のような声明を出した場合: 「全体として、環境の煙にさらされた非喫煙者は、煙にさらされなかった非喫煙者と比較して、冠状動脈性心臓病の相対リスクが1.25(95%信頼区間、1.17〜1.32)でした。」 全体としての人口の相対リスクは何ですか?冠状動脈性心臓病に関連するものはいくつありますか?テストできる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどないため、ランダムに選択された特定のものが関連している可能性はほとんどありません。したがって、母集団の相対リスクは1であると言えますが、引用された間隔には値1が含まれていません。したがって、実際には2つのものの間に関連があり、その確率は非常に小さいか、またはこれは次のいずれかです。パラメータを含まない5%の間隔。後者は前者よりはるかに可能性が高いので、それは私たちが仮定するべきものです。したがって、適切な結論は、データセットがほぼ確実に母集団の非定型であったことです。 もちろん、5%以上が冠状動脈性心疾患に関連していると仮定する根拠がある場合、統計には、環境煙がその1つであるという示唆を裏付ける証拠がいくつかある可能性があります。常識では、これはありそうもないことです。 彼らの推論の誤りは何ですか(すべての保健機関は間接喫煙の有害な影響に関する重要な文献があることに同意しているので)?「検査できる膨大な数の中で、実際に冠状動脈性心臓病に関連しているものはほとんどない」という彼らの前提のせいですか?この文は、ランダムに選択された要因(すなわち、冠動脈疾患のリスクがある人が犬を何匹所有するか)に当てはまる可能性がありますが、先験的確率は、「任意のランダムな要因」よりも、受動喫煙および冠状動脈性心臓病の方がはるかに高いです。 これは正しい推論ですか?または他に何かありますか?

1
ヘッフディングの不等式で使用される補題の証明を理解する
ラリー・ワッサーマンのカセリャとバーガーを主要なテキストとして使用する統計学に関する講義ノートを研究しています。私は彼の講義ノートセット2に取り組んでいますが、ヘッフディングの不等式で使用される補題の導出に行き詰まりました(pp.2-3)。以下の注記で証明を再現しています。証明の後で、どこに行き詰まっているのかを指摘します。 補題 仮定するE(X)=0E(X)=0\mathbb{E}(X) = 0とすることを≤ X ≤ B。次いで、 E(E T X)≤ E T 2(B - A )2 / 8。a≤X≤ba≤X≤b a \le X \le bE(etX)≤et2(b−a)2/8E(etX)≤et2(b−a)2/8\mathbb{E}(e^{tX}) \le e^{t^2 (b-a)^2/8} 証明 以来≤ X ≤ B、我々は書くことができるXを凸状の組合せとして及びB、すなわち X = α B + (1 - α )Aここで、α = X - Aa≤X≤ba≤X≤ba \le X \le bXXXaaabbbX=αb+(1−α)aX=αb+(1−α)aX = …


4
同じ試験を最短で受けることにより、すべての回答を正解する
雨は勉強しないので、はい/いいえの質問のみで構成されていても、中期には完全に無知です。幸い、Rainの教授は彼女が好きなだけ何度でも同じ中間学期を再受験することを許可していますが、彼はスコアを報告するだけなので、Rainは彼女が間違った問題を知りません。Rainは、最低限の回数の再受験ですべての正解を得るにはどうすればよいですか? より正式に言えば、試験の合計は nnn はい/いいえの質問、その正解は X1,X2,…,Xn∼iidBernoulli(0.5)X1,X2,…,Xn∼iidBernoulli(0.5)X_1, X_2, \dots, X_n \stackrel{iid}{\sim} \text{Bernoulli}(0.5)。Rainが再受験する必要があると予想される回数を最小限に抑える戦略を見つけたいです。 しばらく考えていました。レインが初めて中期を取るとき、彼女のスコアは常にBinom(n,0.5)Binom(n,0.5)\text{Binom}(n, 0.5)、彼女の答えに関係なく、各戦略は同じ量のエントロピーを減少させます。しかし、これが何を意味するのかはわかりません。ランダムな推測がすべて「はい」またはすべて「いいえ」で答えるのと同じくらい良いということですか? これは宿題ではありませんが、次の研究プロジェクトをベースに計画しているので、 本格的な答えの代わりにいくつかのヒントを提供してください。 この質問にすでに回答している場合は、ポインタを教えてください。

2
与えられたある確率は何ですか?
XXXとYYYが平均μ=(μ1,μ2)μ=(μ1,μ2)\mu=(\mu_1,\mu_2)と共分散 \ Sigma = \ begin {bmatrix} \ sigma_ {11}&\ sigma_ {12} \\ \ sigma_ {12}&\ sigma_の 2変量正規であると仮定します{22} \\ \ end {bmatrix}Σ=[σ11σ12σ12σ22]Σ=[σ11σ12σ12σ22]\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}。確率Pr(X&lt;Y|min(X,Y))Pr(X&lt;Y|min(X,Y))\Pr\left(X<Y|\min\left(X,Y\right)\right)何ですか?

1
負の確率:素人の説明
ここでの答えにとても興味をそそられました。否定的な確率が何を意味する可能性があるのか​​、そしてそれらのアプリケーションについて、おそらく例を挙げて、より簡単な説明をしたいと思います。たとえば、これらの拡張された確率の測定値によると、イベントの確率が-10%であるとはどういう意味ですか?

2
ランダムグラフの三角形の数の分布と分散
Erdos-Renyiランダムグラフ考えます。個の頂点のセットは、ラベル付けされます。エッジのセットは、ランダムプロセスによって作成されます。N V V = { 1 、2 、... 、N } EG=(V(n),E(p))G=(V(n),E(p))G=(V(n),E(p))nnnVVVV={1,2,…,n}V={1,2,…,n}V = \{1,2,\ldots,n\}EEE ましょう確率であり、各非順序対頂点()内のエッジとして生じる確率で独立他の対の、。0 &lt; p &lt; 1 { i 、j } i ≠ j E pppp0&lt;p&lt;10&lt;p&lt;10<p<1{i,j}{i,j}\{i,j\}i≠ji≠ji \neq jEEEppp の三角形は、、、がエッジであるような、異なる頂点の順序付けされていないトリプルです。。{ i 、j 、k } { i 、j } { j 、k } { k 、i } GGGG{i,j,k}{i,j,k}\{i,j,k\}{i,j}{i,j}\{i,j\}{j,k}{j,k}\{j,k\}{k,i}{k,i}\{k,i\}GGG 可能な三角形の最大数は(n3)(n3)\binom{n}{3}です。確率変数XXXをグラフG内の観測された三角形の数と定義しますGGG。 3つのリンクが同時に存在する確率はp3p3p^3です。したがって、Xの期待値はE(X)= \ …

2
イベントの確率の合計がそれらの結合の確率に等しい場合、それはイベントが互いに素であることを意味しますか?
公理的には、確率は3つの基本的な仮定(コルモゴロフの仮定)を満たす場合、各イベント実数を割り当てる関数です。P (A )APPPP(A )P(A)P(A)あAA P(A )≥ 0 あらゆる用A P(A)≥0 for everyAP(A) \geq 0 \ \text{for every} A P(Ω )= 1P(Ω)=1P(\Omega) = 1 Aの場合 1、A2、⋯ は互いに素であり、P(⋃∞i = 1あ私) = ∑i = 1∞P(A私)If A1,A2,⋯are disjoint, thenP(⋃i=1∞Ai)=∑i=1∞P(Ai)\text{If} \ A_1, A_2, \cdots \text{are disjoint, then}\\ P\left(\bigcup_{i=1}^{\infty}A_i\right) = \sum\limits_{i=1}^{\infty}P(A_i) 私の質問は、最後の仮定では、逆が仮定されているのですか?特定の数のイベントの確率を追加して、それらの結合の確率を取得できることを示した場合、この公理を直接使用して、イベントが互いに素であると主張できますか?

1
ペアワイズ周辺分布から共同分布を取得
3つの確率変数があり、ペアワイズ周辺分布がわかっていると仮定しますが他には何も知りません(そのような条件付き独立として)。結合分布を取得できますか? P (X 1、X 2)、P (X 2、X 3)、P (X 3、X 1)P (X 1、X 2、X 3)バツ1、X2、X3X1,X2,X3X_1,X_2,X_3P(X1、X2)、P(X2、X3)、P(X3、X1)P(X1,X2),P(X2,X3),P(X3,X1)P(X_1,X_2), P(X_2,X_3), P(X_3,X_1)P(X1、X2、X3)P(X1,X2,X3)P(X_1,X_2,X_3)

3
0/10と0/20の比較
タスク達成率について議論するとき、20回の試行のうち0回が10回の試行のうち0回よりも「悪い」ことを示す方法はありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.