タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。

4
平均=中央値は、単峰分布が対称であることを意味しますか?
単峰性分布の場合、平均=中央値であれば、分布は対称であると言えば十分ですか? ウィキペディアは、平均と中央値の関係で次のように述べています。 「分布が対称の場合、平均は中央値に等しく、分布の歪度はゼロになります。さらに、分布が単峰性の場合、平均=中央値=モードです。これは、コイントスまたはシリーズ1、2、3、4、...ただし、一般的に逆は成り立たないことに注意してください。つまり、歪度ゼロは、平均が中央値に等しいことを意味しません。」 ただし、必要な情報を収集することは(私にとって)それほど単純ではありません。助けてください。

2
で支持体として全ての有理数を有する離散RVを構成する
これはこの質問の構成主義者の続編です。 区間内のすべての有理数をサポートする離散均一確率変数を使用できない場合、次に最適なものは次のとおりです。 [0,1][0,1][0,1] 確率変数コンストラクトこの支持有する、それが続くこと一部分布。そして、私の職人は、このランダム変数が、取得したいものを抽象的に定義することによって作成されるのではなく、既存の分布から構築されることを要求しています。QQQQ∈Q∩[0,1]Q∈Q∩[0,1]Q\in \mathbb{Q}\cap[0,1] そこで、私は次のことを思いつきました。 LET幾何分布変パラメータとII以下の離散確率変数であり、すなわち、XXX0&lt;p&lt;10&lt;p&lt;10<p<1 X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1 X \in \{0,1,2,...\},\;\;\;\; P(X=k) = (1-p)^kp,\;\;\; F_X(X) = 1-(1-p)^{k+1} またましょう幾何分布-バリアントI、同一のパラメータでは、次の離散確率変数である、すなわち、YYYppp Y∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)kY∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)k Y \in \{1,2,...\},\;\;\;\; P(Y=k) = (1-p)^{k-1}p,\;\;\; F_Y(Y) = 1-(1-p)^k XXXとは独立しています。ランダム変数を定義しますYYY Q=XYQ=XYQ = \frac {X}{Y} 条件付き分布を検討する P(Q≤q∣{X≤Y})P(Q≤q∣{X≤Y})P(Q\leq q \mid \{X\leq Y\}) ルーズすなわち「条件の比であるを超えるを条件小さいかより等しい」この条件付き分布のサポートは。X Y X Y { 0 、1 、1 / 2 、1 …

3
からサンプリングする方法は
密度f (a )∝ c a d a − 1に従ってサンプリングしたい f(a )∝ cada − 1Γ (a )1(1 、∞ )(a)f(a)∝cada−1Γ(a)1(1,∞)(a) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) ここで、cccとdddは厳密に正です。(動機:これは、ガンマ密度の形状パラメーターが均一な事前分布を持つ場合のギブスサンプリングに役立ちます。) 誰でもこの密度から簡単にサンプリングする方法を知っていますか?たぶんそれは標準的なもので、私が知らないことなのでしょうか? 私は、多かれ少なかれ仕事(モードを見つけるでしょう愚かな拒絶sampliingアルゴリズムと考えることができます*のF、サンプル(、U )大きな箱に均一からを[ 0 、10 * ] × [ 0 、F (A ∗)]およびu &gt; f (a ))の場合は拒否しますが、(i)それはまったく効率的ではなく、(ii)f (a ∗)a∗a∗a^*fff(a,u)(a,u)(a,u)[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]u&gt;f(a)u&gt;f(a)u>f(a)f(a∗)f(a∗)f(a^*)コンピュータが大きすぎて、適度に大きいおよびdでも簡単に処理できません。(大きなcとdのモードはおよそa = c dであることに注意してください。)cccdddcccddda=cda=cda=cd 助けてくれてありがとう!


2
対称分布の定義は何ですか?
対称分布の定義は何ですか?誰かが、Xと− Xが同じ分布を持っている場合に限り、ランダム変数XXXは対称分布から来たと私に言った。しかし、この定義は部分的に正しいと思います。私は反例提示することができますので、X 〜N (μ 、σ 2)とμ ≠ 0を。明らかに、対称的な分布を持っていますが、Xと− Xは異なる分布を持っています!私は正しいですか?この質問について考えたことはありますか?対称分布の正確な定義は何ですか?XXX−X−X-XX∼N(μ,σ2)X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})μ≠0μ≠0\mu\neq0XXX−X−X-X

2
2 t分布の差の分布は何ですか
... なぜ ? 想定すると、はそれぞれ平均および分散独立したランダム変数です。私の基本的な統計の本は、分布には次の特性があることを示しています。X1X1X_1X2X2X_2μ1,μ2μ1,μ2\mu_1,\mu_2σ21,σ22σ12,σ22\sigma^2_1,\sigma^2_2X1−X2X1−X2X_1-X_2 E(X1−X2)=μ1−μ2E(X1−X2)=μ1−μ2E(X_1-X_2)=\mu_1-\mu_2 Var(X1−X2)=σ21+σ22Var(X1−X2)=σ12+σ22Var(X_1-X_2)=\sigma^2_1 +\sigma^2_2 Now let's say X1X1X_1, X2X2X_2 are t-distributions with n1−1n1−1n_1-1, n2−2n2−2n_2-2 degrees of freedom. What is the distribution of X1−X2X1−X2X_1-X_2 ? This question has been edited: The original question was "What are the degrees of freedom of the difference of two t-distributions ?". mpiktas …

1
コミュニティの第4象限に対する見解はどうですか?
ブラックスワンの名声(または悪名高い)のNassim Talebは、この概念について詳しく説明し、「統計の限界の地図」と呼ぶものを開発しました。彼の基本的な議論は、統計モデルの使用が有害である決定問題の一種があるということです。これらは、間違った決定をした結果が非常に高くなる可能性のある決定問題であり、基礎となるPDFを知るのは困難です。 1つの例は、ストックオプションのショートです。この種の操作は、無制限の(少なくとも理論上)損失につながる可能性があります。そして、そのような損失の確率は不明です。実際、多くの人々は確率をモデル化していますが、タレブは、金融市場はいずれのモデルにも自信を持たせるほど古くないと主張します。あなたが今まで見たすべての白鳥が白だからといって、それは黒い白鳥が不可能またはありそうもないことを意味しません。 それでは、ここに質問があります。タレブ氏の議論について、統計コミュニティにコンセンサスのようなものはありますか? たぶん、これはコミュニティwikiであるべきです。知りません。

2
サンプル平均と標準偏差を使用したガンマ分布パラメーターの推定
私は、データサンプルに最適なガンマ分布のパラメーターを推定しようとしています。実際の値ではなく、データサンプルのmean、std(およびそれゆえvariance)のみを使用したいのです-これらはアプリケーションで常に利用できるとは限らないからです。 このドキュメントによれば、次の式を適用して形状とスケールを推定できます。 私は自分のデータでこれを試しましたが、Pythonプログラミングライブラリを使用して実際のデータにガンマ分布をフィッティングするのと比較すると、結果は大きく異なります。 データ/コードを添付して、当面の問題を示します。 import matplotlib.pyplot as plt import numpy as np from scipy.stats import gamma data = [91.81, 10.02, 27.61, 50.48, 3.34, 26.35, 21.0, 79.27, 31.04, 8.85, 109.2, 15.52, 11.03, 41.09, 10.75, 96.43, 109.52, 33.28, 7.66, 65.44, 52.43, 19.25, 10.97, 586.52, 56.91, 157.18, 434.74, 16.07, 334.43, 6.63, 108.41, 4.45, …

2
と仮定し。表示
次の文が正しいことを確認する最も簡単な方法は何ですか? と仮定し。表示。Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1) ことに注意してください。Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq n}Y_i X∼Exp(β)X∼Exp(β)X \sim \text{Exp}(\beta)、この手段そのfX(x)=1βe−x/β⋅1{x&gt;0}fX(x)=1βe−x/β⋅1{x&gt;0}f_{X}(x) = \dfrac{1}{\beta}e^{-x/\beta} \cdot \mathbf{1}_{\{x > 0\}}。 Y _ {(1)} \ sim \ text {Exponential}(1 / n)であることが簡単にわかりますY(1)∼Exponential(1/n)Y(1)∼Exponential(1/n)Y_{(1)} \sim \text{Exponential}(1/n)。さらに、パラメータ化f_ {Y}(y)= \ dfrac {の下に \ sum_ {i = 1} ^ {n} …

3
ベータ分布密度関数に-1があるのはなぜですか?
ベータ分布は2つのパラメーター化(またはここ)で表示されます F (X )α X α(1 - X )βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} または、より一般的に使用されると思われるもの F (X )α X α - 1(1 - X )β - 1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} しかし、なぜ2番目の式に「− 1−1-1」があるのですか? 最初の定式化は直観的に二項分布に直接対応するように思われます g (k )∝ p k(1 − p )n − kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} …

5
統計学者がランダム行列を定義したのはなぜですか?
私は10年前に数学を勉強したので、数学と統計のバックグラウンドを持っていますが、この質問は私を殺します。 この質問は私にとってはまだ少し哲学的です。統計学者がランダム行列を扱うために、あらゆる種類の手法を開発したのはなぜですか?つまり、ランダムなベクトルは問題を解決しなかったのですか?そうでない場合、ランダム行列の異なる列の平均は何ですか?Anderson(2003、Wiley)は、ランダムベクトルを1列のみのランダムマトリックスの特殊なケースと見なしています。 ランダム行列を持つことのポイントがわかりません(そして、それは私が無知だからだと確信しています)。しかし、私と一緒に耐えます。20個のランダム変数を持つモデルがあるとします。結合確率関数を計算したい場合、なぜそれらをベクトルではなく行列として描く必要があるのですか? 私は何が欠けていますか? ps:タグ付けが不十分な質問は申し訳ありませんが、ランダム行列のタグはなく、まだ作成できません! 編集:タイトルのマトリックスをマトリックスに変更

1
二次モーメント法、ブラウン運動?
してみましょう標準ブラウン運動すること。LET示すイベントがおよびします。1はインジケーター関数を示します。\ mathbb {P} \ {K_n \ ge \ rho2 ^ {n} \} \ ge \ rho for all nのような\ rho&gt; 0が存在しますか?答えはイエスだと思う。二次モーメント法をいじってみましたが、あまり役に立ちません。これは、セカンドモーメント法で表示できますか?または、私は何か他のものを試してみるべきですか?E j 、n { B t = 0 いくつかの j − 1BtBtB_tEj,nEj,nE_{j, n}K、N=22NΣJ=2N+11のEjを、nは、1ρ&gt;0P{KN≥ρ2N}≥ρnは{Bt=0 for some j−12n≤t≤j2n},{Bt=0 for some j−12n≤t≤j2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},Kn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = …

1
Hartigansのディップテストの解釈
経験的に得たいくつかの分布の双峰性の強度を定量化する方法を見つけたいと思います。私が読んだことから、二峰性を定量化する方法についてはまだ議論があります。私は、Rで唯一利用できると思われるHartigansのディップテストを使用することを選択しました(元の論文:http : //www.stat.washington.edu/wxs/Stat593-s03/Literature/hartigan85a.pdf)。Hartigansのディップテストは、次のように定義されます。「ディップテストは、経験的分布関数とその最大差を最小化する単峰性分布関数との間のすべてのサンプルポイントでの最大差によって、サンプルのマルチモダリティを測定します」。 この統計を使用する前にどのように解釈すべきかを完全に理解したいと思います。分布がマルチモーダルの場合、ディップテストが増加することを期待していました(「ユニモーダル分布との最大差」として定義されているため)。しかし、マルチモーダル分布に関するウィキペディアのページで、「0.05未満の値は有意な二峰性を示し、0.05を超え0.10未満の値は限界的有意性のある二峰性を示唆している」と読むことができます。。そのような声明はこの論文から来ています(図2)。この論文によると、分布がバイモーダルの場合、ディップテストインデックスは0に近くなります。それは私を混乱させます。 Hartigansのディップテストを正しく解釈するために、いくつかの分布を作成し(元のコードはこちらから)、exp(mu2)の値を増やしました(これから「Bimodularityの強度」と呼ばれます-編集:「Intensity」と呼ぶ必要があります)二峰性の」)二峰性を取得します。最初のグラフでは、分布の例を見ることができます。次に、これらの異なるシミュレートされた分布に関連付けられたdiptestインデックス(2番目のグラフ)とp値(3番目のグラフ)(パッケージdiptest)を推定しました。使用されるRコードは、私の投稿の最後にあります。 ここで示すのは、分布が二峰性の場合、ディップテストインデックスが高く、P値が低いことです。これは、インターネットで読むことができるものとは反対です。 私は統計学の専門家ではないので、ハルティガンの論文をほとんど理解していませんでした。Hartigansのディップテストを解釈する正しい方法についてのコメントを取得したいと思います。どこか間違ってる? 皆さん、ありがとうございました。よろしく、 TA シミュレートされた分布の例: Hartiganのディップテストインデックスが関連付けられています。 Hartiganのディップテストp.value関連: library(diptest) library(ggplot2) # CONSTANT PARAMETERS sig1 &lt;- log(3) sig2 &lt;- log(3) cpct &lt;- 0.5 N=1000 #CREATING BIMOD DISTRIBUTION bimodalDistFunc &lt;- function (n,cpct, mu1, mu2, sig1, sig2) { y0 &lt;- rlnorm(n,mean=mu1, sd = sig1) y1 &lt;- rlnorm(n,mean=mu2, sd = …
18 r  distributions 

1
特定の分散を持つ正規分布の二乗
正規分布確率変数の二乗分布は何であるX2バツ2X^2とX∼N(0,σ2/4)バツ〜N(0、σ2/4)X\sim N(0,\sigma^2/4)? 私が知っているχ2(1)=Z2χ2(1)=Z2\chi^2(1)=Z^2乗する際に有効な引数である標準正規分布は、しかし、どのような非単位分散の場合はどうですか?

3
指数に従うランダム変数の合計がガンマに続き、パラメーターによって混乱します
ガンマ分布に従う指数ランダム変数の合計を学びました。 しかし、パラメータ化はどこでも異なります。たとえば、Wikiは関係を説明していますが、それらのパラメーターが実際に何を意味するのかを述べませんか?形状、スケール、レート、1 /レート? 指数分布: xバツx〜exp(λ)eバツp(λ)exp(\lambda) f(x|λ)=λe−λxf(バツ|λ)=λe−λバツf(x|\lambda )=\lambda {{e}^{-\lambda x}} E[x]=1/λE[バツ]=1/λE[x]=1/ \lambda var(x)=1/λ2var(バツ)=1/λ2var(x)=1/{{\lambda}^2} ガンマ分布:Γ(shape=α,scale=β)Γ(形状=α、規模=β)\Gamma(\text{shape}=\alpha, \text{scale}=\beta) f(x|α,β)=1βα1Γ(α)xα−1e−xβf(バツ|α、β)=1βα1Γ(α)バツα−1e−バツβf(x|\alpha ,\beta )=\frac{1}{{{\beta }^{\alpha }}}\frac{1}{\Gamma (\alpha )}{{x}^{\alpha -1}}{{e}^{-\frac{x}{\beta }}} E[x]=αβE[バツ]=αβE[x]=\alpha\beta var[x]=αβ2var[バツ]=αβ2var[x]=\alpha{\beta}^{2} この設定で、何ですか?正しいパラメーター化はどうなりますか?これをカイ二乗に拡張してみませんか?∑i=1nxi∑私=1nバツ私\sum\limits_{i=1}^{n}{{{x}_{i}}}

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.