タグ付けされた質問 「distributions」

分布は、確率または頻度の数学的記述です。


2
多項分布の係数の合計
\newcommand{\P}{\mathbb{P}}私は公平なサイコロを投げています。1、2、または3を取得するたびに、「1」を書き留めます。4を取得するたびに、「2」を書き留めます。5または6を取得するたびに、「3」を書き留めます。 してみましょうNNNの総数は私はあることを書き留めたすべての数値の積のために必要なスロー可能≥100000≥100000\geq 100000。\ P(N \ geq 25)を計算(または概算)したいのですP(N≥25)P(N≥25)\P(N\geq 25)が、正規分布の関数として概算を与えることができます。 まず、\ log_3 100.000 \約10.48であるため、P(N≥11)=1P(N≥11)=1\P(N\geq 11) = 1ことがlog3100.000≈10.48log3⁡100.000≈10.48\log_3 100.000 \approx 10.48。ここで、aaa、bbb、cccそれぞれ1、2、3と書き留めた回数とします。次に: P(a,b,c∣n)=⎧⎩⎨⎪⎪(na,b,c)(12)a(16)b(13)c0 if a+b+c=n otherwiseP(a,b,c∣n)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise\P(a,b,c\mid n) = \begin{cases}\displaystyle\binom {n}{a, b, c} \left(\frac 1 2\right) ^ a \left(\frac 1 6\right)^b\left(\frac 1 3\right)^c &\text{ if } a + b + c = …

1
分散、歪度、尖度を超える高次キュムラントとモーメントの名前
x (t )x(t)x(t) デリバティブのスナップ、クラックル、ポップを7次まで提案している人もい ます。 機械物理学と弾性理論から発想を得たモーメントは統計学においても重要です。確率分布の「モーメント」について、「モーメント」とは何ですか。K.ピアソンの作品の初期の言及。 000 5次または6次のキュムラント/モーメント、およびそれ以降(「高次のモーメント」を除く)に一般に受け入れられている名前や採用されている名前はありますか? Numerical Recipes 3rd Edition:Art of Scientific Computing、p。723: 歪度(または3番目のモーメント)および尖度(または4番目のモーメント)は注意して使用する必要があります。 これは、ポートフォリオのリスク分析における7次または8次までのモーメントの明らかな使用によって確認されているようです。 その他の注意事項: SE.maths:超歪度の解釈はありますか? スキューを引き起こす際のテールとセンター(モード、ショルダー)の相対的な重要性

1
間隔の比率分布とサンプルの意味は何ですか?
レッツ平均でIID指数確率変数のサンプルで、および聞かせて、このサンプルから順序統計こと。ましょう。X1,…,XnX1,…,XnX_1,\dots,X_nββ\betaX(1),…,X(n)X(1),…,X(n)X_{(1)},\dots,X_{(n)}X¯=1n∑ni=1XiX¯=1n∑i=1nXi\bar X = \frac{1}{n}\sum_{i=1}^n X_i 間隔を定義各も指数関数的であり、平均がことを示すことができます。Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.Wi=X(i+1)−X(i) ∀ 1≤i≤n−1.W_i=X_{(i+1)}-X_{(i)}\ \forall\ 1 \leq i \leq n-1\,. WiWiW_iβi=βn−iβi=βn−i\beta_i=\frac{\beta}{n-i} 質問:が既知で負でない場合、どのように見つけますか?P(WiX¯>t)P(WiX¯>t)\mathbb{P}\left( \frac{W_i}{\bar X} > t \right)ttt 試行:これは1-F_ {W_i} \ left(t \ bar X \ right)に等しいことを知っています1−FWi(tX¯)1−FWi(tX¯)1 - F_{W_i}\left(t \bar X\right)。したがって、私は次のような総確率の法則を使用しました: P(Wi>tX¯)=1−FWi(tX¯)=1−∫∞0FWi(ts)fX¯(s)ds,P(Wi>tX¯)=1−FWi(tX¯)=1−∫0∞FWi(ts)fX¯(s)ds, \mathbb{P}\left( W_i > t \bar X \right) = 1 - F_{W_i}\left( t \bar …

1
なぜサンプル比率も二項分布を持たないのですか?
二項設定では、成功数を与える確率変数Xが二項分布されます。次に、サンプル比率をXとして計算できます。ここで、nはサンプルサイズです。私の教科書はそれを述べていますバツんバツん\frac{X}{n}んんn この比率には二項分布はありません ただし、X以降は単に二項分布の確率変数Xのスケーリングされたバージョンですが、二項分布も持つべきではありませんか?バツんバツん\frac{X}{n}バツバツX

2
凸状の順序付けは、右尾の優位性を意味しますか?
2つの連続分布と与えられた場合、それらの間の凸支配の関係がどうかはわかりません:FバツFX\mathcal{F}_XFYFY\mathcal{F}_Y (0 )Fバツ&lt;cFY(0)FX&lt;cFY(0)\quad \mathcal{F}_X <_c \mathcal{F}_Y ことを意味します (1 )F− 1Y(q)≤ F− 1バツ(q)、∀ Q∈ [ 0.5 、1 ](1)FY−1(q)≤FX−1(q),∀q∈[0.5,1](1)\quad F_Y^{-1}(q) \leq F_X^{-1}(q),\quad \forall q\in[0.5,1] が成立するか、が成立する場合、さらに仮説が必要か?(1 )(1)(1) 凸支配の定義。 2つの連続分布および条件を満たす場合:FバツFX\mathcal{F}_XFYFY\mathcal{F}_Y (2 )F− 1YFバツ(xは) に凸状である X(2)FY−1FX(x) is convex in x(2)\quad F_Y^{-1}F_X(x)\text{ is convex in } x [0]それから私達は書きます: Fバツ&lt;cFYFX&lt;cFYF_X <_c F_Y そして、はよりも右に歪んでいると言います。およびは確率分布であるため、は、の導関数が単調に非減少かつ非負[1]であることも、その は凸型[2]であり、と互いに最大で2回交差します [2]とその[2]、:F X F …

2
乗算できる安定した分布?
安定分布は、畳み込みでは不変です。安定分布のどのサブファミリーも乗算で閉じられますか?場合という意味で、fは∈ FおよびG ∈ F、次いで生成物確率密度関数、F ⋅ G(正規化定数まで)も属するF?FFFf∈ Ff∈Ff\in Fg∈ Fg∈Fg\in F f⋅ グラムf⋅gf \cdot gFFF 注:この質問の内容を大幅に変更しました。しかし、考え方は基本的に同じであり、今でははるかに簡単です。部分的な答えしかなかったので、大丈夫だと思います。

1
がが無限大に近づくにつれて正規分布に収束するという定理はありますか?
レッツ、定義された平均値との任意の分布で、および標準偏差、。中心極限定理は、 が標準正規分布に分布で収束することを示しています。をサンプル標準偏差で置き換える場合、 がt分布に収束して収束するという定理はあり ますか?大きなためXXXμμ\muσσ\sigman−−√X¯−μσnX¯−μσ \sqrt{n}\frac{\bar{X} - \mu}{\sigma} σσ\sigmaSSSn−−√X¯−μSnX¯−μS \sqrt{n}\frac{\bar{X} - \mu}{S} nnnt分布が正規分布に近づくと、定理は、存在する場合、制限が標準正規分布であると述べることができます。したがって、t分布はあまり有用ではないように思えますがほぼ正常な場合にのみ有用です。これは事実ですか? XXX 可能であれば、が置き換えられたときに、このCLTの証明を含む参照を示しますか?そのような参照は、測定理論の概念を使用することができます。しかし、この時点で私にとって何でも素晴らしいことです。σσ\sigmaSSS

2
バーンイン後のMCMC反復を密度推定に使用できますか?
バーンイン後、ヒストグラムのプロットやカーネル密度推定などによる密度推定にMCMC反復を直接使用できますか?私の懸念は、MCMCの反復が独立しているとは限らないことです。 MCMCの反復にさらに間引きを適用するとどうなるでしょうか。私の懸念は、MCMCの反復がせいぜい無相関であり、まだ独立していないことです。 経験的分布関数を真の分布関数の推定として使用するために私が学んだ根拠は、Glivenko–Cantelliの定理に基づいています。ここで、経験的分布関数はiidサンプルに基づいて計算されます。ヒストグラム、またはカーネル密度推定を密度推定として使用する理由(漸近的な結果?)がいくつかあるように見えましたが、それらを思い出すことはできません。

1
空間データへの分布のあてはめ
mathoverflowからの質問をクロスポストして、統計固有のヘルプを見つけます。 私は、負でない値を持つ2次元にうまく投影するデータを生成する物理プロセスを研究しています。各プロセスには、 - yポイントの(投影された)トラックがあります-下の画像を参照してください。xxxyyy サンプルトラックは青で、面倒な種類のトラックは緑で手書きされ、関心領域は赤で描かれています。 各トラックは、独立した実験の結果です。数年間で2千万回の実験が行われましたが、そのうち2千回だけがトラックとしてプロットした特徴を示しています。ここでは、トラックを生成する実験のみを考慮しているため、データセットは(約)2000トラックです。 11110410410^4 任意のトラックが問題の領域に入る可能性をどのように計算できますか? 関心領域に入るトラックが生成される頻度を確認するのに十分な速さで実験を行うことはできないため、利用可能なデータから推定する必要があります。 xxxy≥200y≥200y\ge200 各トラックから問題の領域までの最小距離を調整しましたが、これが正当な結果を生んでいるとは思いません。 1)このタイプのデータに分布を当てはめるための既知の方法はありますか? -または- 2)このデータを使用してトラックを生成するためのモデルを作成する明白な方法はありますか?たとえば、トラックの主成分分析を大きな空間のポイントとして使用し、それらのコンポーネントに投影されたトラックに分布(ピアソン?)を当てはめます。

1
既知の平均絶対偏差の最大エントロピーを持つ分布はどれですか?
平均絶対偏差などの他の指標とは対照的な標準偏差の使用に関するハッカーニュースの議論を読んでいました。それで、最大エントロピーの原理に従うとしたら、分布の平均と絶対絶対偏差しかわからない場合、どのような分布を使用するのでしょうか。 それとも、中央値と中央値からの平均絶対偏差を使用する方が理にかなっていますか? Grechuk、Molyboha、Zabarankinの論文「General Envimation Measures with General Deviation Measures」で最大のエントロピー原理を見つけたのですが、私が知りたい情報があるようですが、それを解読するには少し時間がかかります。

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE &lt;- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
コインを弾く確率の深刻で深刻な問題
コインを1枚投げるとします。連続して4つ以上の連続したヘッドを得るのに必要なフリップの確率を知りたいのですが。 カウントは次のように機能します。連続する1回のフリップのカウントは、ヘッドのみ(4ヘッド以上)です。テールがヒットしてヘッドのストリークを壊すと、カウントは次のフリップから再開します。これは、10,000回のフリップで繰り返されます。 4連以上の頭だけでなく、6頭以上10頭以上の確率を知りたい。9ヘッドのストリークが達成されているかどうかを明確にするために、2つの別々のストリークではなく、1ストリークを4以上(および/または6以上)として集計します。たとえば、コインがTHTHTHTHHHHHH /// THAHTHT ....であった場合、カウントは13になり、次のテイルで再び始まります。 データが右側に大きく歪んでいるとしましょう。平均が40フリップであるので、ストリークが4以上になるには平均がかかり、分布はu = 28です。明らかにゆがんでいます。 現時点では何も見つからない場合を除いて、説明的なデータから意味のある方法を見つけるために最善を尽くしています。 私はそれからある意味のある確率を得る何らかの方法を見つけたいです。+/- 1 SDが68%である通常の曲線のように、ログの正規化を調べましたが、これは実際には私の目標ではないパラメトリックテストにのみ使用されています。 私はベータ版のディストリビューションについて教えられましたが、私がこれまでに提案したことはすべてかなり混乱しています。私は1年前にこの質問をして、いくつかの洞察を得ましたが、残念ながら、私にはまだ答えがありません。アイデアをお持ちの方、ありがとうございました。

2
非対称分布のカーネル密度推定
ましょう不明(確かに非対称)確率分布から引き出される観測。{ x1、… 、xN}{バツ1、…、バツN}\{x_1,\ldots,x_N\} 私はKDEのアプローチを使用して確率分布を見つけたい ただし、ガウスカーネルを使用しようとしましたが、対称であるため、パフォーマンスが低下しました。したがって、ガンマカーネルとベータカーネルに関するいくつかの作業がリリースされたことがわかりましたが、それらの操作方法はわかりませんでした。f^(x )= 1NhΣi = 1NK( x − x私h)f^(バツ)=1NhΣ私=1NK(バツ−バツ私h) \hat{f}(x) = \frac{1}{Nh}\sum_{i=1}^{N} K\bigl(\frac{x-x_i}{h}\bigr) 私の質問は次のとおりです。基礎となる分布のサポートが区間でないとすると、この非対称のケースを処理する方法を?[ 0 、1 ][0、1][0,1]

2
ロジスティック関数で変換されたガウス確率変数の期待値
通常、ロジスティック関数と標準偏差はどちらも表されσσ\sigmaます。標準偏差にはσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))とsssを使用します。 私はランダムな入力を持つロジスティックニューロンを持っています。その平均μμ\muと標準偏差sssは知っています。平均との差がガウスノイズで近似できることを願っています。したがって、表記を少し乱用して、生成すると仮定しますσ(μ+N(0,s2))=σ(N(μ,s2))σ(μ+N(0,s2))=σ(N(μ,s2))\sigma(\mu + N(0,s^2))=\sigma(N(\mu,s^2))。σ (N (μ 、s 2))の期待値は何ですか?σ(N(μ,s2))σ(N(μ,s2))\sigma(N(\mu,s^2))標準偏差sssは、μμ\muまたはと比較して大きい場合と小さい場合があります111。期待値の適切な閉じた形の近似は、閉じた形の解とほぼ同じです。 閉じた形のソリューションは存在しないと思います。これは、畳み込みとみなすことができ、およびロジスティック密度のための特徴的な機能が知られている()が、私は確かにそれがどのように役立つかあまりないです。逆シンボリック計算機はで密度を認識することができませんでした0ロジスティック分布の密度の畳み込みと示唆しているが、単純な基本整数が存在しないことを証明しない標準正規分布、の。より状況証拠:ロジスティックニューロンを含むニューラルネットワークにガウス入力ノイズを追加することに関するいくつかの論文では、これらの論文は閉形式の式も提供していませんでした。πt csch πtπt csch πt\pi t ~\text{csch} ~\pi t000 この質問は、ボルツマンマシンの平均場近似の誤差を理解しようとするときに生じました。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.