タグ付けされた質問 「probability」

確率は、特定のイベントの起こりそうな発生の定量的な説明を提供します。


1
複数の予測子を持つロジットモデルの確率曲線のグラフ化
次の確率関数があります。 確率= 11 + e− zプロブ=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} どこ z= B0+ B1バツ1+ ⋯ + Bnバツn。z=B0+B1バツ1+⋯+Bnバツn。z = B_0 + B_1X_1 + \dots + B_nX_n. 私のモデルは次のように見えます Pr (Y= 1 )= 11 + exp(− [ − 3.92 + 0.014 × (bid )] )Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(入札)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} これは、以下のような確率曲線を介して視覚化されます。 元の回帰式にいくつかの変数を追加することを検討しています。性別(カテゴリ:FおよびM)および年齢(カテゴリ:<25および> …

1
正規分布の分解
この分布からの2つの独立したサンプルの差が正規分布するような正のみの分布が存在しますか?もしそうなら、それは単純な形をしていますか?

2
セットの測度の指数の偏りのない推定量?
設定我々は(測定及び適切行儀)を有すると仮定S⊆B⊂RnS⊆B⊂RnS\subseteq B\subset\mathbb R^n、BBBコンパクトです。さらに、ルベーグ測度λ (⋅ )についてBBB上の均一分布からサンプルを抽出でき、測度λ (B )がわかっていると仮定します。たとえば、おそらくBはSを含むボックス[ − c 、c ] nです。λ(⋅)λ(⋅)\lambda(\cdot)λ(B)λ(B)\lambda(B)BBB[−c,c]n[−c,c]n[-c,c]^nSSS 固定のためのα∈Rα∈R\alpha\in\mathbb R、推定する簡単な公正な方法があるe−αλ(S)e−αλ(S)e^{-\alpha \lambda(S)}均一の点サンプリングによってBBB、それらが内部または外部であるか否かをチェックSSS? なく、かなりの仕事をして何かの例として、仮定我々のサンプルkkkポイントp1,…,pk∼Uniform(B)p1,…,pk∼Uniform(B)p_1,\ldots,p_k\sim\textrm{Uniform}(B)。その後、我々は、モンテカルロ推定に使用することができλ(S)≈λ^:=#{pi∈S}kλ(B).λ(S)≈λ^:=#{pi∈S}kλ(B).\lambda(S)\approx \hat\lambda:= \frac{\#\{p_i\in S\}}{k}\lambda(B). 一方、しかし、 λはの不偏推定量であるλ(S)、私はそれがある場合だとは思わない電子-α λはの不偏推定量であるE-αλ(S)。このアルゴリズムを変更する方法はありますか?λ^λ^\hat\lambdaλ(S)λ(S)\lambda(S)e−αλ^e−αλ^e^{-\alpha\hat\lambda}e−αλ(S)e−αλ(S)e^{-\alpha\lambda(S)}

1
重要性サンプリングの直感的な例
私のバックグラウンドはコンピュータサイエンスです。私はモンテカルロサンプリング手法にかなり慣れていないので、数学は理解していますが、重要性サンプリングの直感的な例を思い付くのに苦労しています。より正確には、誰かが以下の例を提供できますか? 元の分布はサンプリングできないが、推定できる この元の分布からサンプリングして適切な重要度分布。

1
独立のための共同MGFに関する必要かつ十分な条件
CDFとの共同分布に対して、共同モーメント生成関数があるとします。あるの両方に必要かつ十分の独立の条件と?私は必要性だけを述べたいくつかの教科書を調べた:F X 、Y(X 、Y )M X 、Y(S 、T )= M X 、Y(S 、0 )⋅ M X 、Y(0 、T )X YMX,Y(s,t)MX,Y(s,t)M_{X,Y}(s,t)FX,Y(x,y)FX,Y(x,y)F_{X,Y}(x,y)MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)M_{X,Y}(s,t)=M_{X,Y}(s,0)⋅M_{X,Y}(0,t)XXXYYY Fバツ、Y(x 、y)= Fバツ(X )⋅ FY(y)⟹Mバツ、Y(s 、t )= Mバツ(S )⋅ MY(t )FX,Y(x,y)=FX(x)⋅FY(y)⟹MX,Y(s,t)=MX(s)⋅MY(t)F_{X,Y}(x,y)=F_X(x)\cdot F_Y(y) \implies M_{X,Y}(s,t)=M_X(s) \cdot M_Y(t) 独立性が意味するため、この結果は明らかです。周辺のMGFは共同MGFによって決定されるため、次のようになります。MX,Y(s,t)=E(esX+tY)=E(esX)E(etY)MX,Y(s,t)=E(esX+tY)=E(esX)E(etY)M_{X,Y}(s,t)=\mathbb{E}(e^{sX+tY})=\mathbb{E}(e^{sX}) \mathbb{E}(e^{tY}) X,Y independent⟹MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)X,Y independent⟹MX,Y(s,t)=MX,Y(s,0)⋅MX,Y(0,t)X,Y\text{ independent} \implies M_{X,Y}(s,t)=M_{X,Y}(s,0)⋅M_{X,Y}(0,t) しかし、オンラインで検索したところ、証拠がない、コンバースへの一時的な参照しか見つかりませんでした。次のスケッチプルーフは機能しますか? ジョイントMGF与えられると、これは、とおよびそれらのMGF の周辺分布を一意に決定します。M_X および。単独で周辺分布は、多くの他の可能な関節分布と互換性があり、一意た関節の分布を決定及び CDFと独立している、およびMGF:X Y …

2
詳細なバランスを満たすMCMCは定常分布をもたらしますか?
遷移確率と定常分布πに対して、マルコフ連鎖はq (x | y )π (y )= q (y | x )π (x )、qqqππ\piq(x | y)π(y)= q(y| x)π(x )、q(x|y)π(y)=q(y|x)π(x),q(x|y)\pi(y)=q(y|x)\pi(x), これは、次のように言い換えると、より理にかなっています。 q(x | y)q(y| x)= π(x )π(y)。q(x|y)q(y|x)=π(x)π(y).\frac{q(x|y)}{q(y|x)}= \frac{\pi(x)}{\pi(y)}. 基本的に、状態から状態yへの遷移の確率は、それらの確率密度の比に比例するはずです。バツxxyyy


5
同じ分布族からの2つのランダム変数が同じ期待値と分散を持つが、より高いモーメントが異なる可能性はありますか?
ロケーションスケールの家族の意味を考えていました。私の理解では、ロケーションスケールファミリーのすべてのメンバーについて、パラメーターがロケーションとbスケールである場合、Z = (X − a )/ bの分布はパラメーターに依存せず、それに属するすべてのXについて同じです。家族。XXXaaabbbZ=(X− a )/ bZ=(X−a)/bZ =(X-a)/bバツXX だから私の質問は、同じ分布ファミリーからの2つのランダムが標準化されているが、同じ分布のランダム変数にならない例を提供できますか? セイとYは、同じ分布族から来た(家族と私は例ノーマルまたは両方ガンマなどの両方の意味で...)。定義:バツXXYYY Z1= X- μσZ1=X−μσZ_1 = \dfrac{X-\mu}{\sigma} Z2= Y- μσZ2=Y−μσZ_2 = \dfrac{Y-\mu}{\sigma} 我々は両方のことを知っている及びZ 2は同じ期待と分散、持っているμ Z = 0 、σ 2 Z = 1。Z1Z1Z_1Z2Z2Z_2μZ= 0 、σ2Z= 1μZ=0,σZ2=1\mu_Z =0, \sigma^2_Z =1 しかし、彼らは異なるより高い瞬間を持つことができますか? この質問に答えようとする私の試みは、とYの分布が2つ以上のパラメーターに依存している場合、それよりも大きくなる可能性があるということです。そして、私は3つのパラメーターを持つ一般化されたt − s t u d e n tについて考えています。バツXXYYYt − …

1
ヤコビアン因子による異なる確率密度変換
ビショップではパターン認識と機械学習、私はちょうど確率密度の後、以下の読みp(x∈(a,b))=∫bap(x)dxp(x∈(a,b))=∫abp(x)dxp(x\in(a,b))=\int_a^bp(x)\textrm{d}x導入されました。 変数の非線形変化の下では、確率密度は、ヤコビアン係数のために、単純な関数とは異なる形で変換されます。我々は変数の変化を検討した場合、例えば、x=g(y)x=g(y)x = g(y)、関数f(x)f(x)f(x)となる f~(y)=f(g(y))f~(y)=f(g(y))\tilde{f}(y) = f(g(y))。次に、密度p y(y )に対応する確率密度px(x)px(x)p_x(x)を考えます。py(y)py(y)p_y(y) 新しい変数yyyに関して、ここで、px(x)px(x)p_x(x)とpy(y)py(y)p_y(y)は異なる密度であるという事実を示します。範囲内の観察(x,x+δx)(x,x+δx)(x, x + \delta x)の値が小さいためであろう δxδx\delta x、範囲に変換する(y,y+δy(y,y+δy(y, y + \delta y) px(x)δx≃py(y)δypx(x)δx≃py(y)δyp_x(x)\delta x \simeq p_y(y)δy、ひいてはpy(y)=px(x)|dxdy|=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y) = p_x(x) |\frac{dx}{dy}| = p_x(g(y)) | g\prime (y) |。 ヤコビアンファクターとは何ですか?正確に何が(多分定性的に)どういう意味ですか?ビショップは、この性質の結果は確率密度の最大値の概念は変数の選択に依存するということであると言います。これは何を意味するのでしょうか? 私には、これは少しおかしくなります(序章にあると考えてください)。ヒントをお願いします、ありがとう!

2
「Xのエラー」モデルがより広く使用されないのはなぜですか?
回帰係数の標準誤差を計算するとき、計画行列ランダム性は考慮しません。たとえばOLSでは、をとして計算しますXXXvar(β^)var(β^)\text{var}(\hat{\beta})var((XTX)−1XTY)=σ2(XTX)−1var((XTX)−1XTY)=σ2(XTX)−1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} がランダムであると見なされる場合、総分散の法則は、ある意味で、の分散の追加の寄与も要求します。すなわちXXXXXX var (β^)= var (E(β^| バツ))+ E(var (β^| バツ))。var(β^)=var(E(β^|X))+E(var(β^|X)).\text{var}(\hat{\beta}) = \text{var}(E(\hat{\beta}|X)) + E(\text{var}(\hat{\beta}|X)). これは、OLS推定量が本当に不偏である場合、期待値が一定であるため、最初の項が消えます。2番目の項は実際には次のようになります:。σ2cov (X)− 1σ2cov(X)−1\sigma^2 \text{cov}(X)^{-1} パラメトリックモデルがわかっている場合は、を実際の共分散推定値に置き換えてみませんか。たとえば、が無作為化された治療の割り当てである場合、二項分散より効率的な推定値にする必要がありますか?XXXXTXXTXX^TXXXXE(X)(1−E(X))E(X)(1−E(X))E(X)(1-E(X)) 柔軟なノンパラメトリックモデルを使用して、OLS推定でのバイアスの考えられる原因を推定し、最初の合計の法則分散項設計への感度(つまりの分布)を適切に考慮しないのはなぜですか?XXXvar(E(β^|X))var(E(β^|X))\text{var}(E(\hat{\beta}|X))

1
iidガンマ変量の合計の制限
レッツ確率密度関数とは独立同一分布確率変数のシーケンスです。 ショーそのf (x )= { 1X1,X2,…X1,X2,…X_1,X_2,\ldotsf(x)={12x2e−x0if x>0;otherwise.f(x)={12x2e−xif x>0;0otherwise. f(x) = \left\{ \begin{array}{ll} \frac{1}{2}x^2 e^{-x} & \mbox{if $x>0$};\\ 0 & \mbox{otherwise}.\end{array} \right. limn→∞P[X1+X2+…+Xn≥3(n−n−−√)]≥12limn→∞P[X1+X2+…+Xn≥3(n−n)]≥12\lim_{n\to \infty} P[X_1+X_2+\ldots+X_n\ge 3(n-\sqrt{n})] \ge \frac{1}{2} 私が試みたもの 問題は下限を表示することを求めているため、一見してチェビシェフの不等式を使用する必要があると思いました。しかし、問題が中央限界定理(CLT)に何らかの形で関連している可能性があることを明確に示す限界標識について考えました X1+X2+…+XnX1+X2+…+XnX_1+X_2+\ldots +X_n ましょうSn=X1+X2+…+XnSn=X1+X2+…+XnS_n=X_1+X_2+\ldots +X_n E(Sn)=∑i=0nE(Xi)=3n (since E(Xi)=3)V(Sn)=∑i=0nV(Xi)=3n (since V(Xi)=3 and Xi are i.i.d)E(Sn)=∑i=0nE(Xi)=3n (since E(Xi)=3)V(Sn)=∑i=0nV(Xi)=3n (since V(Xi)=3 and Xi are i.i.d)E(S_n)=\sum_{i=0}^{n} …

5
(分類で行うように)0.5レベルではなく0.05レベルで帰無仮説を棄却する理由
仮説検定は分類問題に似ています。したがって、観察(サブジェクト)には2つの可能なラベルがある-ギルティ対非ギルティ。Non-Guiltyを帰無仮説とします。問題を分類の観点から見た場合、データが与えられると、2つのクラスのそれぞれに属する主題の確率を予測する分類子をトレーニングします。次に、確率が最も高いクラスを選択します。その場合、0.5の確率が自然なしきい値になります。誤検知エラーと誤検知エラーに異なるコストを割り当てた場合、しきい値を変更する可能性があります。ただし、しきい値を0.05に設定するほど極端になることはほとんどありません。つまり、確率が0.95以上の場合にのみ、サブジェクトをクラス「ギルティ」に割り当てます。でもよくわかったら これは、仮説検定の問題と同じ問題を見るときに標準的な方法として行っていることです。後者の場合、「非ギルティ」である確率が5%未満の場合にのみ、「非ギルティ」というラベルは割り当てません。そして、もし私たちが無実の人々に有罪判決を下すことを本当に避けたいのであれば、これはおそらく理にかなっているでしょう。しかし、なぜこのルールがすべてのドメインとすべてのケースで適用されるのでしょうか? どの仮説を採用するかを決定することは、データを与えられた真実の推定者を定義することと同じです。最尤推定では、データが与えられる可能性が高いという仮説を受け入れます。ただし、圧倒的に可能性が高いとは限りません。以下のグラフをご覧ください。 最尤法を使用すると、この例では予測子の値が3を超える場合(4など)、対立仮説が優先されますが、この値が帰無仮説から導出される確率は0.05よりも大きくなります。 そして、私が投稿を始めた例はおそらく感情的に訴えられますが、技術的な改善など、他のケースを考えることができます。新しいソリューションが改善である確率が改善ではない確率よりも高いことがデータから示されたときに、なぜステータスクオにそのような利点を与える必要があるのですか?

1
逆誕生日問題:100万人の宇宙人のうち、ペアが誕生日を共有することはありません。彼らの年の長さは何ですか?
非常に長いNNN日の惑星を想定します。部屋のパーティーには100万人の外国人がいて、誕生日を共有する人はいません。のサイズについて何が推測できますか?NNN (このよりコンパクトな質問は、この不適切なフレーズの質問に取って代わります。)

2
52枚のデッキから20枚のカードが引かれたときに、フォーカードを引く確率はどのくらいですか?
昨日、ハウスメイトと私はカードゲームをしていて、誰かがこの質問をしました。私たちは問題を解決しようとしましたが、それを理解することができませんでした。今朝、目が覚めたのですが、どうすれば解決できるのかまだ疑問に思っています。手伝ってくれませんか。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.