タグ付けされた質問 「random-variable」

確率変数または確率変数は、偶然の変動(すなわち、数学的な意味でのランダム性)の影響を受ける値です。


6
10分と15分ごとに実行される2つのバスの最初の待ち時間の期待値
私はインタビューの質問に出くわしました: 10分ごとに来る赤い電車があります。15分ごとに青い電車が出ています。どちらもランダムな時間から開始されるため、スケジュールはありません。ランダムな時間に駅に到着し、最初に来る電車に乗る場合、予想される待ち時間はどれくらいですか?

5
離散変数と連続変数の関係を視覚化する最良の方法は何ですか?
以下の関係を示す最良の方法は何ですか? 連続変数と離散変数、 2つの離散変数? これまで、散布図を使用して連続変数間の関係を調べてきました。ただし、離散変数の場合、データポイントは特定の間隔で累積されます。したがって、最適なラインは偏っている可能性があります。

1
コミュニティの第4象限に対する見解はどうですか?
ブラックスワンの名声(または悪名高い)のNassim Talebは、この概念について詳しく説明し、「統計の限界の地図」と呼ぶものを開発しました。彼の基本的な議論は、統計モデルの使用が有害である決定問題の一種があるということです。これらは、間違った決定をした結果が非常に高くなる可能性のある決定問題であり、基礎となるPDFを知るのは困難です。 1つの例は、ストックオプションのショートです。この種の操作は、無制限の(少なくとも理論上)損失につながる可能性があります。そして、そのような損失の確率は不明です。実際、多くの人々は確率をモデル化していますが、タレブは、金融市場はいずれのモデルにも自信を持たせるほど古くないと主張します。あなたが今まで見たすべての白鳥が白だからといって、それは黒い白鳥が不可能またはありそうもないことを意味しません。 それでは、ここに質問があります。タレブ氏の議論について、統計コミュニティにコンセンサスのようなものはありますか? たぶん、これはコミュニティwikiであるべきです。知りません。

1
サンプルサイズをランダム変数にすることはどういう意味ですか?
Frank Harrellがブログ(統計的思考)を開始しました。彼の最高の投稿では、彼の統計哲学のいくつかの重要な特徴をリストしています。他のアイテムの中で、含まれるもの: 可能な場合、サンプルサイズをランダム変数にする 「サンプルサイズをランダム変数にする」とはどういう意味ですか? これを行う利点は何ですか?なぜそれが好ましいのでしょうか?

5
統計学者がランダム行列を定義したのはなぜですか?
私は10年前に数学を勉強したので、数学と統計のバックグラウンドを持っていますが、この質問は私を殺します。 この質問は私にとってはまだ少し哲学的です。統計学者がランダム行列を扱うために、あらゆる種類の手法を開発したのはなぜですか?つまり、ランダムなベクトルは問題を解決しなかったのですか?そうでない場合、ランダム行列の異なる列の平均は何ですか?Anderson(2003、Wiley)は、ランダムベクトルを1列のみのランダムマトリックスの特殊なケースと見なしています。 ランダム行列を持つことのポイントがわかりません(そして、それは私が無知だからだと確信しています)。しかし、私と一緒に耐えます。20個のランダム変数を持つモデルがあるとします。結合確率関数を計算したい場合、なぜそれらをベクトルではなく行列として描く必要があるのですか? 私は何が欠けていますか? ps:タグ付けが不十分な質問は申し訳ありませんが、ランダム行列のタグはなく、まだ作成できません! 編集:タイトルのマトリックスをマトリックスに変更


2
2つの確率変数の合計としての一様確率変数
GrimmetおよびStirzakerから取得: そうでないことを示すU = X + Y Uは均一[0,1]上に分散され、XおよびYは独立しており、同一分布。あなたはないはず XとYが連続変数であることを前提としています。U=X+YU=X+YUUXXYY 場合の矛盾で十分によって簡単証明XXX、Yは、YYそれが常に可能見つけることと主張することによって別個に仮定され、Uuu及びU 'u′u'その結果、P (U ≤ U + U ')≥ P (U ≤ U )P(U≤u+u′)≥P(U≤u)P(U\leq u+u') \geq P(U\leq u)一方、P (X + Y ≤ U )= P (X + Y ≤ U + U ')P(X+ Y≤ U )= P(X+ Y≤ U + U′)P(X+Y \leq u) …


1
ランダム変数とその分布の表記規則
意味の適切な表記法だけでなく、ランダム変数とその分布に関連する表記法の意味についても混乱しています。以下に、私が真実だと思う事柄と、私が理解していない事柄をリストし、入力/修正が大好きです。参照しやすいように、各ポイント/質問に番号を付けました。このような単一の質問に項目をリストするのが適切でない場合は、お知らせください。全部短いので大丈夫だと思いました。 ランダム変数は大文字で表記されます(例:。XXX ランダム変数の操作とはどういう意味ですか?(たとえば、を言葉でどのように解釈しますか?)。X2X2X^2 ランダム変数からの特定の描画は、小文字(例:)、添え字付き小文字(例:)、または大文字付き数字(例:)のいずれかで表記されます。x 1 x 1xxxx1x1x_1X1X1X_1 ある確率変数の順序統計値ランダム変数から引くと表記されて。n X X k nkthkthkthnnnXXXXknXknX_{kn} 「XはF(x)(または「cdf F(x)」または「B(a、b)」または分布を特徴付ける任意の方法で分布する確率変数です)」と書く簡単な方法はありますか? CAN Iライトに従って分布変数の期待値を意味するために?F (x )EF(x)EF(x)\mathbb{E}F(x)F(x)F(x)F(x) たとえば、変数Xのcdfで演算を実行し、を実行して、から最大2つのドローのcdfを取得します。何とか? X XFnew(x)=Fold(x)2Fnew(x)=Fold(x)2F_{new}(x) = F_{old}(x)^2XXXXXX 簡潔に書くのに適切な方法はまたはですか?F 2(x )F (x )2(F(x))2(F(x))2(F(x))^2F2(x)F2(x)F^2(x)F(x)2F(x)2F(x)^2 離散変数と連続変数に表記上の違いはありますか?

1
与えられたMLEでランダムサンプルをシミュレートする
一定の金額を持っていることを条件とするサンプルのシミュレーションについて尋ねるこの相互検証された質問は、ジョージ・カセラによって私に設定された問題を思い出させました。 パラメトリックモデルとこのモデルのiid​​サンプル が与えられると、のMLEは与えられます 指定された値の\ thetaに対して、iidサンプル(X_1、\ ldots、X_n)をシミュレートする一般的な方法がありますMLE \ hat {\ theta}(X_1、\ ldots、X_n)の値を条件としていますか?f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)θθ\theta(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) たとえば、位置パラメーター\ muでT5T5\mathfrak{T}_5分布を取り、その密度はf(x | \ mu)= \ dfrac {\ Gamma(3)} {\ Gamma(1/2)\ Gamma( 5/2)} \、\ left [1+(x- \ mu)^ 2/5 \ right] ^ {-3} If (X_1、\ ldots、X_n)\ stackrel {\ text {iid}} {\ sim} f(x | \ mu)\ …

2
分布何ですか、一様分布では?
4つの独立した均一に分布した変数あります 。の分布を計算したい。Iは、分布計算あるとしたがって)、およびは今、合計分布は(も独立)理由a,b,c,da,b,c,da,b,c,d[0,1][0,1][0,1](a−d)2+4bc(a−d)2+4bc(a-d)^2+4bcu2=4bcu2=4bcu_2=4bcf2(u2)=−14lnu24f2(u2)=−14ln⁡u24f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}u2∈(0,4]u2∈(0,4]u_2\in(0,4]u1=(a−d)2u1=(a−d)2u_1=(a-d)^2f1(u1)=1−u1−−√u1−−√.f1(u1)=1−u1u1.f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.u1+u2u1+u2u_1+u_2u1,u2u1,u2u_1,\, u_2fu1+u2(x)=∫+∞−∞f1(x−y)f2(y)dy=−14∫401−x−y−−−−√x−y−−−−√⋅lny4dy,fu1+u2(x)=∫−∞+∞f1(x−y)f2(y)dy=−14∫041−x−yx−y⋅ln⁡y4dy,f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,y∈(0,4]y∈(0,4]y\in(0,4]。ここでは、でなければならないため、積分は等しくなりそれをMathematicaに挿入して、x>yx>yx>yfu1+u2(x)=−14∫x01−x−y−−−−√x−y−−−−√⋅lny4dy.fu1+u2(x)=−14∫0x1−x−yx−y⋅ln⁡y4dy.f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.fu1+u2(x)=14[−x+xlnx4−2x−−√(−2+lnx)].fu1+u2(x)=14[−x+xln⁡x4−2x(−2+ln⁡x)].f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right]. 私はそれぞれ個の数字で構成される4つの独立したセット作成し、ヒストグラムを描きました:a,b,c,da,b,c,da,b,c,d10610610^6(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc そしてプロットを描きました:fu1+u2(x)fu1+u2(x)f_{u_1+u_2}(x) 一般に、プロットはヒストグラムに似ていますが、間隔ほとんどが負です(ルートは2.27034です)。そして、正の部分の積分はです。(0,5)(0,5)(0,5)≈0.77≈0.77\approx 0.77 間違いはどこですか?それとも、どこで何かが欠けていますか? 編集: PDFを表示するためにヒストグラムをスケーリングしました。 編集2:私は推論のどこに問題があるのか​​を知っていると思う-統合の限界。そのためと、私はできません単にプロットショー私は統合する必要があり地域。:y∈(0,4]y∈(0,4]y\in (0,4]x−y∈(0,1]x−y∈(0,1]x-y\in(0,1]∫x0∫0x\int_0^x つまり、にはがあり(これが、一部が正しい理由です)、にがあり、 in。残念ながら、Mathematicaは後者の2つの積分の計算に失敗します(まあ、2番目の計算は、出力に虚数単位があり、すべてを損なうため... )。∫x0∫0x\int_0^xy∈(0,1]y∈(0,1]y\in(0,1]fff∫xx−1∫x−1x\int_{x-1}^xy∈(1,4]y∈(1,4]y\in(1,4]∫4x−1∫x−14\int_{x-1}^4y∈(4,5]y∈(4,5]y\in (4,5] 編集3: Mathematicaは次のコードで最後の3つの積分を計算できるようです: (1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0] (1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0] (1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 …

3
「検定統計量」は値またはランダム変数ですか?
私は今、最初の統計コースを受講している学生です。「テスト統計」という用語に混乱しています。 以下(一部の教科書でこれを見ました)では、は特定のサンプルから計算された特定の値であるようです。 tttt=x¯¯¯−μ0s/n−−√t=x¯−μ0s/n t=\frac{\overline{x} - \mu_0}{s / \sqrt{n}} ただし、以下では(他の教科書でこれを見ました)、はランダム変数のようです。 TTTT=X¯¯¯¯−μ0S/n−−√T=X¯−μ0S/n T=\frac{\overline{X} - \mu_0}{S / \sqrt{n}} それでは、用語「検定統計量」は特定の値またはランダム変数、あるいはその両方を意味しますか?

1
2つの独立したランダム変数、正規およびカイ二乗の積のpdf
XとYが独立している場合、2つの独立したランダム変数XとYの積のpdfは何ですか?Xは正規分布、Yはカイ二乗分布です。 Z = XY 場合正規分布を有する およびは、自由度が カイ二乗分布 ここで、は単位ステップ関数です。XXXX∼N(μx,σ2x)X∼N(μx,σx2)X\sim N(\mu_x,\sigma_x^2) fX(x)=1σx2π−−√e−12(x−μxσx)2fX(x)=1σx2πe−12(x−μxσx)2f_X(x)={1\over\sigma_x\sqrt{2\pi}}e^{-{1\over2}({x-\mu_x\over\sigma_x})^2}YYYkkkY∼χ2kY∼χk2Y\sim \chi_k^2 fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)f_Y(y)={y^{(k/2)-1}e^{-y/2}\over{2^{k/2}\Gamma({k\over2})}}u(y)u(y)u(y)u(y) とが独立している場合、のpdfはどうなりますか?ZZZXXXYYY 解決策を見つけるための一つの方法は、場合Rohatgiのよく知られた結果(1976、141頁)を使用することである連続的なRVののジョイントPDFである及びのPDF、である fXY(x,y)fXY(x,y)f_{XY}(x,y)XXXYYYZZZfZ(z)=∫∞−∞1|y|fXY(zy,y)dyfZ(z)=∫−∞∞1|y|fXY(zy,y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{XY}({z\over y},y)dy} なぜなら、とは独立している 積分を解く問題に直面する場所。誰でもこの問題で私を助けることができます。XXXYYYfXY(x,y)=fX(x)fY(y)fXY(x,y)=fX(x)fY(y)f_{XY}(x,y)=f_X(x)f_Y(y) fZ(z)=∫∞−∞1|y|fX(zy)fY(y)dyfZ(z)=∫−∞∞1|y|fX(zy)fY(y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{X}({z\over y})f_{Y}(y)dy} fZ(z)=1σx2π−−√12k/2Γ(k2)∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyfZ(z)=1σx2π12k/2Γ(k2)∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyf_Z(z) = {1\over\sigma_x\sqrt{2\pi}}{1\over{2^{k/2}\Gamma({k\over2})}}\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over y}-\mu_x\over\sigma_x})^2} {y^{(k/2)-1}e^{-y/2}}dy} ∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over y}-\mu_x\over\sigma_x})^2} {y^{(k/2)-1}e^{-y/2}}dy} これを解決する代替方法はありますか?

4
必要なサンプルサイズ、分散推定の精度を計算していますか?
バックグラウンド 分布が不明な変数があります。 500個のサンプルがありますが、分散を計算できる精度を実証したいと思います。たとえば、サンプルサイズ500で十分だと主張します。また、分散を精度で推定するために必要な最小サンプルサイズを知ることに興味があります。X%X%X\% ご質問 どうすれば計算できますか サンプルサイズ所与分散の私の推定値の精度??n=500n=500n=500n=Nn=Nn=N 精度で分散を推定するために必要なサンプルの最小数を計算するにはどうすればよいですか?XXX 例 図1 500サンプルに基づくパラメーターの密度推定。 図2これは、x軸のサンプルサイズと、500のサンプルのサブサンプルを使用して計算したy軸の分散の推定値のプロットです。nが増加すると、推定値は真の分散に収束します。 。 ただし、分散を推定するために使用されるサンプルは互いに独立していないか、分散を計算するために使用されるサンプルとはN ∈ [ 20 、40 、80 ]n∈[10,125,250,500]n∈[10,125,250,500]n \in [10,125,250,500]n∈[20,40,80]n∈[20,40,80]n\in [20,40,80]

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.