タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

2
期待
LET、、、と無関係です。の期待は何ですか?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} は対称で簡単に見つけることができます。しかし、私はの期待値を見つける方法を知りません。ヒントを教えてください。E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}バツ41(X21+ ⋯ + X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} これまでに入手したもの を対称的に見つけたかった。しかし、この場合には、の場合と異なっているので、は。だから私は期待を見つけるためにいくつかの他のアイデアが必要です。E (X41(X21+ ⋯ + X2d)2)E(X14(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X21バツ21+ ⋯ + X2d)E(X12X12+⋯+Xd2)\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right)E (X4私(X21+ ⋯ + X2d)2)E(Xi4(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E (X2私バツ2j(X21+ ⋯ …

2
多項分布の係数の合計
\newcommand{\P}{\mathbb{P}}私は公平なサイコロを投げています。1、2、または3を取得するたびに、「1」を書き留めます。4を取得するたびに、「2」を書き留めます。5または6を取得するたびに、「3」を書き留めます。 してみましょうNNNの総数は私はあることを書き留めたすべての数値の積のために必要なスロー可能≥100000≥100000\geq 100000。\ P(N \ geq 25)を計算(または概算)したいのですP(N≥25)P(N≥25)\P(N\geq 25)が、正規分布の関数として概算を与えることができます。 まず、\ log_3 100.000 \約10.48であるため、P(N≥11)=1P(N≥11)=1\P(N\geq 11) = 1ことがlog3100.000≈10.48log3⁡100.000≈10.48\log_3 100.000 \approx 10.48。ここで、aaa、bbb、cccそれぞれ1、2、3と書き留めた回数とします。次に: P(a,b,c∣n)=⎧⎩⎨⎪⎪(na,b,c)(12)a(16)b(13)c0 if a+b+c=n otherwiseP(a,b,c∣n)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise\P(a,b,c\mid n) = \begin{cases}\displaystyle\binom {n}{a, b, c} \left(\frac 1 2\right) ^ a \left(\frac 1 6\right)^b\left(\frac 1 3\right)^c &\text{ if } a + b + c = …

1
間隔の比率分布とサンプルの意味は何ですか?
レッツ平均でIID指数確率変数のサンプルで、および聞かせて、このサンプルから順序統計こと。ましょう。X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i 間隔を定義各も指数関数的であり、平均がことを示すことができます。Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq n-1\,. WiWiW_iβi=βn−iβi=βn−i\beta_i=\frac{\beta}{n-i} 質問:が既知で負でない場合、どのように見つけますか?P(WiX¯>t)P(WiX¯>t)\mathbb{P}\left( \frac{W_i}{\bar X} > t \right)ttt 試行:これは1-F_ {W_i} \ left(t \ bar X \ right)に等しいことを知っています1−FWi(tX¯)1−FWi(tX¯)1 - F_{W_i}\left(t \bar X\right)。したがって、私は次のような総確率の法則を使用しました: P(Wi>tX¯)=1−FWi(tX¯)=1−∫∞0FWi(ts)fX¯(s)ds,P(Wi>tX¯)=1−FWi(tX¯)=1−∫0∞FWi(ts)fX¯(s)ds, \mathbb{P}\left( W_i > t \bar X \right) = 1 - F_{W_i}\left( t \bar …

1
証明/反証
証明/反証E[1A|Ft]=0 or 1 a.s. ⇒E[1A|Fs]=E[1A|Ft] a.s.E[1A|Ft]=0 or 1 a.s. ⇒E[1A|Fs]=E[1A|Ft] a.s.E[1_A | \mathscr{F_t}] = 0 \ \text{or} \ 1 \ \text{a.s.} \ \Rightarrow E[1_A | \mathscr{F_{s}}] = E[1_A | \mathscr{F_t}] \ \text{a.s.} フィルター処理された確率空間が与えられると、。(Ω,F,{Fn}n∈N,P)(Ω,F,{Fn}n∈N,P)(\Omega, \mathscr{F}, \{\mathscr{F}_n\}_{n \in \mathbb{N}}, \mathbb{P})A∈FA∈FA \in \mathscr{F} 仮定それは従ってい何についての?∃t∈N s.t. E[1A|Ft]=1 a.s.∃t∈N s.t. E[1A|Ft]=1 a.s.\exists t \in \mathbb{N} …

2
凸状の順序付けは、右尾の優位性を意味しますか?
2つの連続分布と与えられた場合、それらの間の凸支配の関係がどうかはわかりません:FバツFX\mathcal{F}_XFYFY\mathcal{F}_Y (0 )Fバツ&lt;cFY(0)FX&lt;cFY(0)\quad \mathcal{F}_X <_c \mathcal{F}_Y ことを意味します (1 )F− 1Y(q)≤ F− 1バツ(q)、∀ Q∈ [ 0.5 、1 ](1)FY−1(q)≤FX−1(q),∀q∈[0.5,1](1)\quad F_Y^{-1}(q) \leq F_X^{-1}(q),\quad \forall q\in[0.5,1] が成立するか、が成立する場合、さらに仮説が必要か?(1 )(1)(1) 凸支配の定義。 2つの連続分布および条件を満たす場合:FバツFX\mathcal{F}_XFYFY\mathcal{F}_Y (2 )F− 1YFバツ(xは) に凸状である X(2)FY−1FX(x) is convex in x(2)\quad F_Y^{-1}F_X(x)\text{ is convex in } x [0]それから私達は書きます: Fバツ&lt;cFYFX&lt;cFYF_X <_c F_Y そして、はよりも右に歪んでいると言います。およびは確率分布であるため、は、の導関数が単調に非減少かつ非負[1]であることも、その は凸型[2]であり、と互いに最大で2回交差します [2]とその[2]、:F X F …


4
私が表示したい
LET確率空間上の確率変数である .SHOWそのX:Ω→NX:Ω→NX:\Omega \to \mathbb N(Ω,B,P)(Ω,B,P)(\Omega,\mathcal B,P)E(X)=∑n=1∞P(X≥n).E(X)=∑n=1∞P(X≥n).E(X)=\sum_{n=1}^\infty P(X\ge n). からの私の定義は、と等しくなり E(X)E(X)E(X)E(X)=∫ΩXdP.E(X)=∫ΩXdP.E(X)=\int_\Omega X \, dP. ありがとう。

3
コインを弾く確率の深刻で深刻な問題
コインを1枚投げるとします。連続して4つ以上の連続したヘッドを得るのに必要なフリップの確率を知りたいのですが。 カウントは次のように機能します。連続する1回のフリップのカウントは、ヘッドのみ(4ヘッド以上)です。テールがヒットしてヘッドのストリークを壊すと、カウントは次のフリップから再開します。これは、10,000回のフリップで繰り返されます。 4連以上の頭だけでなく、6頭以上10頭以上の確率を知りたい。9ヘッドのストリークが達成されているかどうかを明確にするために、2つの別々のストリークではなく、1ストリークを4以上(および/または6以上)として集計します。たとえば、コインがTHTHTHTHHHHHH /// THAHTHT ....であった場合、カウントは13になり、次のテイルで再び始まります。 データが右側に大きく歪んでいるとしましょう。平均が40フリップであるので、ストリークが4以上になるには平均がかかり、分布はu = 28です。明らかにゆがんでいます。 現時点では何も見つからない場合を除いて、説明的なデータから意味のある方法を見つけるために最善を尽くしています。 私はそれからある意味のある確率を得る何らかの方法を見つけたいです。+/- 1 SDが68%である通常の曲線のように、ログの正規化を調べましたが、これは実際には私の目標ではないパラメトリックテストにのみ使用されています。 私はベータ版のディストリビューションについて教えられましたが、私がこれまでに提案したことはすべてかなり混乱しています。私は1年前にこの質問をして、いくつかの洞察を得ましたが、残念ながら、私にはまだ答えがありません。アイデアをお持ちの方、ありがとうございました。

2
非対称分布のカーネル密度推定
ましょう不明(確かに非対称)確率分布から引き出される観測。{ x1、… 、xN}{バツ1、…、バツN}\{x_1,\ldots,x_N\} 私はKDEのアプローチを使用して確率分布を見つけたい ただし、ガウスカーネルを使用しようとしましたが、対称であるため、パフォーマンスが低下しました。したがって、ガンマカーネルとベータカーネルに関するいくつかの作業がリリースされたことがわかりましたが、それらの操作方法はわかりませんでした。f^(x )= 1NhΣi = 1NK( x − x私h)f^(バツ)=1NhΣ私=1NK(バツ−バツ私h) \hat{f}(x) = \frac{1}{Nh}\sum_{i=1}^{N} K\bigl(\frac{x-x_i}{h}\bigr) 私の質問は次のとおりです。基礎となる分布のサポートが区間でないとすると、この非対称のケースを処理する方法を?[ 0 、1 ][0、1][0,1]

1
無限ランダム幾何学グラフでランダムウォークを行うロボットの密度
ノードの位置が密度ポアソン点プロセスに従い、エッジがdよりも近いノード間に配置されている無限ランダム幾何学グラフを考えてみます。したがって、エッジの長さは次のPDFに従います。ρρ\rhoddd f(l )= { 2 ld2L ≤ D0l &gt; df(l)={2ld2l≤d0l&gt;d f(l)= \begin{cases} \frac{2 l}{d^2} \;\quad l \le d \\ 0 \qquad\; l > d \end{cases} 上のグラフで、原点を中心とする半径の円の内側のノードを考えます。時間t = 0で、言及した各ノードの内側に小さなロボットを配置するとします。つまり、平面上のロボットの密度は次のように与えられます。rrrt = 0t=0t=0 ここで、lは原点からの距離です。次の図は、ロボットの初期配置の例を示しています。g(l )= { ρL ≤ R0l &gt; dg(l)={ρl≤r0l&gt;d g(l)= \begin{cases} \rho \quad l \le r \\ 0 \quad\; l > …

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

2
IIDランダム法線の最大次数統計量の漸近分布
素敵な極限分布があるとしては、n個に行く\ inftyの彼らがあることを想定し、IID分散を持つ正規分布\シグマ^ 2。max(X1,X2,...,Xn)max(X1,X2,...,Xn)\max( X_1,X_2,...,X_n) ∞nnn∞∞\inftyσ2σ2\sigma^2 これはほぼ間違いなく、巧妙な証明と優れたソリューションを備えたよく知られている問題ですが、私は何も調べていませんでした。

6
バイナリ結果の一連のカテゴリカル予測子の予測力を評価する方法は?確率またはロジスティック回帰を計算しますか?
私は、単純な確率が私の問題で機能するかどうか、またはロジスティック回帰などのより洗練された方法を使用(および学習)する方が良いかどうかを判断しようとしています。 この問題の応答変数はバイナリ応答(0、1)です。私はすべてカテゴリカルで順序付けされていない多数の予測変数を持っています。私は、予測変数のどの組み合わせが1の割合が最も高いかを判断しようとしています。ロジスティック回帰は必要ですか?カテゴリカル予測子の各組み合わせについて、サンプルセットの比率を計算するだけの利点は何ですか?

1
なぜ私たちは自分の直感を確率で信頼できないのですか?
これが明らかになるケースがあったとしても、それはモンティホールの問題です。偉大なポール・エルドスでさえ、この問題にだまされました。答えるのが難しいかもしれない私の質問は、私たちが直感的な議論を理解し、それでもそれほど間違っている答えに自信を持つことができる確率については何ですか。1桁目のベンフォードの法則と待ち時間のパラドックスは、このような他の有名な例です。

4
塩基対の特定のシーケンスを見つける確率
確率について考えると、いつも自分が数えるのがどれほど悪いのかがわかります... 基本文字Aのシーケンスを考えます。んnn、それぞれが等しく可能性が登場します。このシーケンスは、長さの関心のベースペアの特定のシーケンスが含まれている確率は何である R ≤ nが?A 、T、C、 および GA,T,C, and GA,\; T, \; C, \text{ and } GR ≤ Nr≤nr\leq n ある異なるが(等しく可能性)の可能な配列。完全なシーケンスの先頭にある目的のシーケンスから始めます。このような4つのn − rシーケンスが可能です。n + 1 − rの異なる場所で目的のシーケンスを開始できます。したがって、私の答えは(n + 1 − r )/ 4 rです。4ん4n4^n4n − r4n−r4^{n-r}n + 1 − rn+1−rn+1 -r(n + 1 − r )/ 4r(n+1−r)/4r(n+1-r)/4^r この確率はで増加しており、私には理にかなっています。しかし、n &gt; 4 …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.