タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。

2
コイン投げのベータ分布
クルシュケのベイジアンの本は、コインを弾くためのベータ分布の使用に関して、 たとえば、コインに表側と裏側があるという知識以外に事前知識がない場合、これは以前にa = 1とb = 1に対応する1つの頭と1つの尾を観察したことと同じです。 なぜ1つの頭と1つの尾を見たことに等しい情報がないのですか?0頭と0尾は私にとってより自然に見えます。

3
応用確率を学ぶのに良い本ですか?
私は、確率論を深く厳密にカバーした本を探していますが、数学部門の外でほとんど役立つ資料に重点を置いています。「確率論:探求と応用」はかなり良いと聞いたが、他にもいくつかの提案をしたかった。 たとえば、Achim Klenkeの本は私にとっては大きすぎます...私が知る限り、それはアプリケーションではなく定理証明のために編成されています。また、私が調べたものからのダレットの本や、ビリングスリーやフェラーの大ファンではありません。

3
さらに別の中心極限定理の質問
ましょう持つ独立したベルヌーイ・ランダム変数のシーケンスである セット 示すこと分布に収束する標準正規変数にとして無限大になる傾向があります。、P { X K = 1 } = 1 - P { X K = 0 } = 1{Xn:n≥1}{Xn:n≥1}\{X_n:n\ge1\}Sn= n ∑ k=1(Xk−1P{Xk=1}=1−P{Xk=0}=1k.P{Xk=1}=1−P{Xk=0}=1k.P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}. SnSn=∑k=1n(Xk−1k), B2n=∑k=1nk−1k2Sn=∑k=1n(Xk−1k), Bn2=∑k=1nk−1k2S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2} ZnSnBnSnBn\frac{S_n}{B_n}ZZZnnn 私の試みはLyapunov CLTを使用することです。したがって、ような が存在することを示す必要がありますδ>0δ>0\delta>0リムn → ∞1B2 + δんΣk = 1んE[ | バツk− 1k|2 + δ] = 0。limn→∞1Bn2+δ∑k=1nE[|Xk−1k|2+δ]=0.\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0. したがって、n ∑ k …

2
ベイズ分類器が理想的な分類器であるのはなぜですか?
これは、カテゴリーの基礎となる確率構造が完全にわかっている理想的なケースと見なされます。 なぜベイズ分類器を使用すると、達成可能な最高のパフォーマンスが得られるのですか? これの正式な証明/説明は何ですか?常にベイズ分類器をベンチマークとして使用して、他のすべての分類器のパフォーマンスを比較します。


4
確率理論を使用してバスキューを終了するか、そこに留まるかを選択する方法は?
しばらく考えていたのですが、確率論があまり上手ではないので、この質問をするのにいい場所だと思いました。これは、公共交通機関の長い行列の中で私に思いついたものです。 あなたがバス停にいて、バス(または複数のバス)が確かに将来(日中)来ると知っているが、正確な瞬間がわからないとします。バスが5分以内に到着する確率を想像してみてください。だからあなたは5分待ちます。しかし、バスは到着しません。現在の確率は、想像した元の確率よりも低いですか、それとも高いですか? 問題は、過去を使用して未来を予測している場合、バスの到着についてあまり楽観的ではないからです。しかし、多分あなたはそれが実際にイベントをより起こりやすくすることを考えることもできます:バスがまだ到着していないので、1日の利用可能な時間が少なくなり、したがって確率が高くなります。 その日の最後の5分間を考えてみてください。あなたは一日中そこに行っていて、バスは来ていません。したがって、過去からだけでは、バスが今後5分以内に到着すると予測することはできません。しかし、バスは1日の終わりまでに到着し、1日の終わりは5分しかないため、5分以内にバスが到着することを100%確信できます。 したがって、問題は、確率を計算してキューからドロップする場合、どの方法を使用する必要があるかです。途中でやめて急にバスが来る時もあるけど、待って待って待ってバスが来ない時があるから。それとも、この質問全体がナンセンスであり、それが単にひどくランダムなのでしょうか?

1
GLMにはいくつのディストリビューションがありますか?
私は、GLMが5つの分布(つまり、ガンマ、ガウス、二項、逆ガウス、およびポアソン)で記述されている教科書の複数の場所を特定しました。これは、Rの家族関数でも例示されています。 追加のディストリビューションが含まれているGLMへの参照に遭遇することがあります(例)。これらの5つがなぜ特別なのか、または常にGLMにあるのか、誰かがなぜ他の人が特別なのかを誰かが説明できますか? 私がこれまでに学んだことから、指数関数的に家族の中でGLM分布フォームにすべて適合: ここで、ϕは分散パラメーター、θは正準パラメーターです。f(y;θ,ϕ)=exp{yθ−b(θ)ϕ+c(y,ϕ)}f(y;θ,ϕ)=exp⁡{yθ−b(θ)ϕ+c(y,ϕ)}f(y;\theta,\phi)=\exp\left\{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\right\}ϕϕ\phiθθ\theta GLMに適合するように分布を変換することはできませんか?

1
PDFの関数の凸性と標準正規確率変数のCDF
Q (x ) = x 2 + x ϕ (x )であることを証明してください凸状である∀X>0。ここで、ϕとΦはそれぞれ標準の標準PDFとCDFです。Q(x)=x2+xϕ(x)Φ(x)Q(x)=x2+xϕ(x)Φ(x)Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)}∀x>0∀x>0\forall x>0 ϕϕ\phiΦΦ\mathbf{\Phi} 試した手順 1)計算方法 私は微積分法を試してみましたが、第二導関数の計算式を持っているが、それはポジティブであることを示すことができないですしている。詳細が必要な場合はお知らせください。∀x>0∀x>0\forall x > 0 最後に、 ∂ Q (X )Let Q(x)=x2+xϕ(x)Φ(x)Let Q(x)=x2+xϕ(x)Φ(x)\begin{eqnarray*} \text{Let }Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ Q (X )∂Q(x)∂x=2x+x[−xϕ(x)Φ(x)−{ϕ(x)Φ(x)}2]+ϕ(x)Φ(x)∂Q(x)∂x=2x+x[−xϕ(x)Φ(x)−{ϕ(x)Φ(x)}2]+ϕ(x)Φ(x)\begin{eqnarray*} \frac{\partial Q\left(x\right)}{\partial x} & = & 2x+x\left[-\frac{x\phi\left(x\right)}{\Phi\left(x\right)}-\left\{ \frac{\phi\left(x\right)}{\Phi\left(x\right)}\right\} ^{2}\right]+\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ 2 Q(X)∂Q(x)∂x∣∣∣x=0=ϕ(0)Φ(0)>0∂Q(x)∂x|x=0=ϕ(0)Φ(0)>0\begin{eqnarray*} \left.\frac{\partial Q\left(x\right)}{\partial x}\right|_{x=0} & …

3
タイプIおよびIIのエラーの確率は負の相関関係がありますか?
私がTAだった初等統計クラスで、教授は、タイプIエラーの確率が増加するにつれて、タイプIIエラー確率が減少し、その逆も真であると述べました。したがって、これはことを私に示唆してい。β ρ α 、β &lt; 0αα\alphaββ\betaρα 、β&lt; 0ρα,β&lt;0\rho_{\alpha, \beta} < 0 しかし、一般的な仮説検定でこれをどのように証明しますか?声明は一般的にも真実ですか? 特定のケース(たとえば、および)を試すこともできますが、明らかに、この質問を処理するには一般的ではありません。H 1:μ &lt; μ 0H0:μ = μ0H0:μ=μ0H_0: \mu = \mu_0H1:μ &lt; μ0H1:μ&lt;μ0H_1: \mu < \mu_0

1
多変量正規分布と共変量を使用したベイズモデリング
説明変数があるとします。ここで、sは特定の座標を表します。また、応答変数Y = ( Y (s 1)、… 、Y (s n))があります。これで、両方の変数を次のように組み合わせることができます。X=(X(s1),…,X(sn))X=(X(s1),…,X(sn)){\bf{X}} = \left(X(s_{1}),\ldots,X(s_{n})\right)sssY=(Y(s1),…,Y(sn))Y=(Y(s1),…,Y(sn)){\bf{Y}} = \left(Y(s_{1}),\ldots,Y(s_{n})\right) W(s)=(X(s)Y(s))∼N(μ(s),T)W(s)=(X(s)Y(s))∼N(μ(s),T){\bf{W}}({\bf{s}}) = \left( \begin{array}{ccc}X(s) \\ Y(s) \end{array} \right) \sim N(\boldsymbol{\mu}(s), T) この場合、我々は単に選択とTは関係について説明共分散行列であり、X及びYは。これは、sでのXとYの値のみを示します。XとYの他の場所からのポイントが多いため、次のように W(s)のより多くの値を記述できます。μ(s)=(μ1μ2)Tμ(s)=(μ1μ2)T\boldsymbol{\mu}(s) = \left( \mu_{1} \; \; \mu_{2}\right)^{T}TTTXXXYYYXXXYYYsssXXXYYYW(s)W(s){\bf{W}}(s) (XY)=N((μ11μ21),T⊗H(ϕ))(XY)=N((μ11μ21),T⊗H(ϕ))\left( \begin{array}{ccc} {\bf{X}} \\ {\bf{Y}} \end{array}\right) = N\left(\left(\begin{array}{ccc}\mu_{1}\boldsymbol{1}\\ \mu_{2}\boldsymbol{1}\end{array}\right), T\otimes H(\phi)\right) とYのコンポーネントを再配置して、列内のすべてのX (s i)を取得し、その後、すべてのY (s i)を連結します。各成分H (ϕ )i …

1
「.632ルール」で確率が等しくない場合はどうなりますか?
この質問は、「。632ルール」に関するこの質問に由来しています。問題を簡単にするために、user603の回答/表記を特に参照して書いています。 その答えは、大きさのサンプルから始まる交換と、からNコレクション内の異なる項目(呼び出し)はN.確率I Tの時間サンプルは、sのiは、特定の要素の異なるM Nのは、次に(1 - 1 / n )。n,n,n,nnnithithi^{th}sisis_immm(1−1/n).(1−1/n).(1 - 1/n). その答えでは、Nのすべての要素がランダムに描かれる可能性が等しくなります。 私の質問はこれです。代わりに、上記の質問で、描かれるアイテムが通常配布されるようなものであるとします。つまり、標準正規曲線をからZ = 4まで(たとえば)100の等しい長さの部分区間に分割します。Nの100個のアイテムはそれぞれ、描画される確率があり、それぞれの間隔で曲線が範囲となる領域に等しい。Z=−4Z=−4Z = -4Z=4Z=4Z = 4 私の考えは次のとおりです。 推論はリンクされた回答のそれと同じだと思います。mがNの要素であるである確率はP (s i ≠ m )= (1 − F i)であり、ここでF iはs iを描画する確率です。si≠msi≠ms_i \ne mmmmP(si≠m)=(1−Fi)P(si≠m)=(1−Fi)P(s_i \neq m) = (1 - F_i)FiFiF_isi.si.s_i. 特定の要素mがサイズnのサンプルSにある確率は = 1 - nはΠ 1(1 - F 、I)。P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m \in …

2
実験を再実行してWeb A / Bテストを検証します-これは有効ですか?
先日、A / Bテスト会社によるウェビナーで、居住者の「データサイエンティスト」に、実験を再実行して結果を検証する必要があることを説明してもらいました。前提として、95%の信頼度を選択した場合、誤検知の可能性は5%(1/20)です。同じ制約で実験を再実行すると、1/400になります(これは0.05 ^ 2 = 1/400と決定したと仮定しています) これは有効な発言ですか?(つまり、「2回実行すると、2つの統計的有意性の勝利=偽陽性の1/400の確率」)?それはあなたの有意水準を上げるためのより良いアプローチだったでしょうか? ビジネスの観点から、私が懸念しているのは、実験を再実行することです。つまり、より多くのユーザーを劣ったページ(処理)にさらし、潜在的な売り上げを失うことになります。

1
2D正規分布の半径のサンプリング分布
平均および共分散行列の2変量正規分布は、半径および角度極座標でことができます。私の質問は、のサンプリング分布とは何ですか、つまり、サンプルの共分散行列与えられたに、点から推定中心までの距離のサンプリング分布は何ですか?Sμμ\muΣΣ\Sigmaθ R X ˉ Xrrrθθ\thetar^r^\hat{r}xxxx¯x¯\bar{x}SSS 背景:ポイントから平均までの真の距離は、ホイト分布に従います。固有値との、及び、その形状パラメータである、およびそのスケールパラメータはです。累積分布関数は、2つのMarcum Q関数の対称差であることがわかっています。rrrxxxλ 1、λ 2 Σ λ 1 &gt; λ 2、Q = 1μμ\muλ1,λ2λ1,λ2\lambda_{1}, \lambda_{2}ΣΣ\Sigmaλ1&gt;λ2λ1&gt;λ2\lambda_{1} > \lambda_{2}q=1(λ1+λ2)/λ2)−1√q=1(λ1+λ2)/λ2)−1q=\frac{1}{\sqrt{(\lambda_{1}+\lambda_{2})/\lambda_{2})-1}}ω=λ1+λ2ω=λ1+λ2\omega = \lambda_{1} + \lambda_{2} シミュレーションは、および推定およびを真のcdfにプラグインすると、大きなサンプルでは機能するが、小さなサンプルでは機能しないことを示唆しています。次の図は、200回の結果を示していますx¯x¯\bar{x}SSSμμ\muΣΣ\Sigma 指定された(軸)、(行)、および変位値(列)の各組み合わせについて、20個の2D法線ベクトルをシミュレートしますqqqxxxωω\omega 各サンプルについて、観測された半径からの特定の分位数を計算し r^r^\hat{r}x¯x¯\bar{x} 各サンプルについて、理論的なホイトから分位数(2D正常)累積分布関数を計算し、サンプル推定値をプラグインした後理論レイリーCDFからと。x¯x¯\bar{x}SSS 以下のように(分布が円形になる)、1に近づき、推定ホイトの位数は影響を受けない推定レイリー分位近づく。、特に分布のテールにおける経験的分位と推定するものが増加との間に、差異を、成長します。Q ωqqqqqqωω\omega

2
現実のネットワーク/グラフのすべてのエッジが統計的に偶然に発生する可能性が高いとはどういう意味ですか?
このホワイトペーパーで概説されているバックボーンネットワーク抽出方法を使用しています。http://www.pnas.org/content/106/16/6483.abstract 基本的に、著者は、グラフの各エッジに対して、エッジが偶然に起こった可能性がある確率を生成する統計に基づく方法を提案します。典型的な統計的有意性カットオフ0.05を使用しています。 私はこの方法をいくつかの現実のネットワークに適用してきましたが、興味深いことに、一部のネットワークはエッジがそれほど重要ではなくなります。これがネットワークに何を伴うかを理解しようとしています。この方法をネットワークに適用したがエッジがまったくなかったのは、生成したランダムなネットワークにこの方法を適用したときだけでした。これはまさに期待通りの結果でした。 実社会のネットワークの例として、エコノミストが過去25年間に米国上院の二極化を示した最近のネットワークの視覚化を見たことがあります:http : //www.economist.com/news/united-states/21591190 -united-states-amoeba。これらのネットワークにバックボーンネットワーク抽出方法を適用しましたが、重要なエッジはありませんでした。生のエッジは明らかに優先的な接続とクラスタリングを示していますが、これは偶然ですか?上院の投票ネットワークは本質的にランダムですか?

2
T分布確率変数の二乗和の分布
T分布確率変数の二乗和の分布と、テール指数調べています。Xがrvである場合、フーリエ変換であるは、畳み込み前の正方形の解を与えます。 αα\alphaX2X2X^2F(t)F(t)\mathscr{F}(t)F(t)nF(t)n\mathscr{F}(t)^nF(t)=∫∞0exp(itx2)⎛⎝⎜⎜⎜(αα+x2)α+12α−−√ B(α2,12)⎞⎠⎟⎟⎟dxF(t)=∫0∞exp⁡(itx2)((αα+x2)α+12α B(α2,12))dx\mathscr{F}(t)=\int_0^{\infty } \exp \left(i\, t\, x^2\right)\left(\frac{\left(\frac{\alpha }{\alpha +x^2}\right)^{\frac{\alpha +1}{2}} }{\sqrt{\alpha }\ B\left(\frac{\alpha }{2},\frac{1}{2}\right)}\right) \, \mathrm{d}x で、溶液をフーリエ逆変換を行うと逆することができるが、扱いにくいと不可能である。したがって、問題は、標本分散の分布またはT分布確率変数の標準偏差で作業が行われたかどうかです。(Gaussianのカイ二乗とは、StudentTにとってのものです)。ありがとうございました。F(t )nα=3α=3\alpha=3F(t)nF(t)n\mathscr{F}(t)^n (考えられる解決策)はフィッシャー分布であるため、フィッシャー分布変数の合計を確認します。 F (1 、α )X2X2X^2F(1,α)F(1,α)F(1,\alpha) (可能な解決策)特性関数から、合計された平均 は、分布の最初の2つのモーメントが存在する場合、それらのモーメントは同じです。したがって、uを平方根とし、確率分布内で変数を変更すると、n個のサンプルのT変数の標準偏差の密度は、次のように近似できます X 2 F (N 、α )G (U )= 2 α α / 2 N N / 2 UはN - 1 ( α + …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.