タグ付けされた質問 「cdf」

累積分布関数。PDFは確率変数の各値の確率密度を示しますが、CDF(多くの場合、Fバツ)確率変数が指定された値以下になる確率を与えます。

1
参考資料:逆累積分布関数の末尾
統計で次の結果を見たことがあると思いますが、どこで思い出せないのでしょうか。 場合正の確率変数であり、E(X )&lt; ∞、次いでε F - 1(1 - ε )→ 0ときε → 0 +、Fでの累積分布関数であるX。XXXE(X)&lt;∞E(X)&lt;∞\mathbb{E}(X)<\inftyεF−1(1−ε)→0εF−1(1−ε)→0\varepsilon F^{-1}(1-\varepsilon) \to 0ε→0+ε→0+\varepsilon\to 0^+FFFXXX これは、等式を使用して幾何学的に見ることは容易であるとの水平カット考慮しε積分の曲線下面積の1 - Fを。E(X)=∫1−FE(X)=∫1−F\mathbb{E}(X)=\int 1-Fεε\varepsilon1−F1−F1-F この結果の参照と、名前があるかどうか知っていますか?

2
ランダム変数を独自のpdfまたはcdfにプラグインする背後にある直感的な意味は何ですか?
pdfは通常、として記述されます。小文字のxは、そのpdfを持つ確率変数Xの実現または結果として扱われます。同様に、cdfはF X(x )として記述され、P (X &lt; x )の意味を持ちます。ただし、スコア関数の定義やcdfが均一に分布しているというこの導出など、状況によっては、確率変数Xが独自のpdf / cdfにプラグインされているように見えます。そうすることで、f(x|θ)f(x|θ)f(x|\theta)xxxXXXFX(x)FX(x)F_X(x)P(X&lt;x)P(X&lt;x)P(X<x)XXX新しいランダム変数 またはZ = F X(X )。それ自体が確率変数になり、後者の場合、「解釈」F X(X )= P (X &lt; X )は私にはナンセンスのように見えるので、これをpdfまたはcdfと呼ぶことはもうできないと思います。Y= f(X| θ)Y=f(X|θ)Y=f(X|\theta)Z= Fバツ(X)Z=FX(X)Z=F_X(X)Fバツ(X)= P(X&lt; X)FX(X)=P(X&lt;X)F_X(X)=P(X<X) さらに、上記の後者の場合、「確率変数の累積分布関数は一様分布に従う」という文を理解していることを確信できません。cdfは関数であり、確率変数ではないため、分布はありません。むしろ、一様な分布を持つのは、独自の累積分布関数を表す関数を使用して変換された確率変数ですが、この変換がなぜ意味があるのか​​はわかりません。同じことがスコア関数にも当てはまります。ここでは、独自の対数尤度を表す関数にランダム変数を挿入します。 私はこれらの変換の背後にある直感的な意味を考え出そうと何週間も頭を悩ませてきましたが、行き詰まっています。どんな洞察もいただければ幸いです!

1
相互に排他的でないカテゴリを分類できる深層学習モデル
例:仕事の説明に「英国のJavaシニアエンジニア」という文があります。 私は2つのカテゴリとして、それを予測することは、深い学習モデルを使用したい:English とIT jobs。従来の分類モデルを使用する場合softmax、最後のレイヤーで機能を持つ1つのラベルのみを予測できます。したがって、2つのモデルのニューラルネットワークを使用して、両方のカテゴリで「はい」/「いいえ」を予測できますが、さらに多くのカテゴリがあると、コストがかかりすぎます。では、2つ以上のカテゴリを同時に予測するためのディープラーニングまたは機械学習モデルはありますか? 「編集」:従来のアプローチによる3つのラベルでは、[1,0,0]によってエンコードされますが、私の場合、[1,1,0]または[1,1,1]によってエンコードされます 例:3つのラベルがあり、文がこれらすべてのラベルに収まる場合。したがって、softmax関数からの出力が[0.45、0.35、0.2]である場合、3つのラベルまたは2つのラベルに分類する必要がありますか、それとも1つにすることができますか?それを行うときの主な問題は、1、2、または3つのラベルに分類するための適切なしきい値は何ですか?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
片側コルモゴロフ・スミルノフ検定からの
片側コルモゴロフスミルノフ検定のppp値を取得する方法を理解しようとしています。2標本の場合、D + n 1、n 2およびD − n 1、n 2の CDFを見つけるのに苦労しています。以下は、1つのサンプルの場合のD + nの CDFとしていくつかの場所で引用されています。D+n1,n2Dn1,n2+D^{+}_{n_{1},n_{2}}D−n1,n2Dn1,n2−D^{-}_{n_{1},n_{2}}D+nDn+D^{+}_{n} p+n(x)=P(D+n≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jpn+(x)=P(Dn+≥x|H0)=x∑j=0⌊n(1−x)⌋(nj)(jn+x)j−1(1−x−jn)n−jp^{+}_{n}\left(x\right) = \text{P}\left(D^{+}_{n} \ge x | \text{H}_{0}\right) = x\sum_{j=0}^{\lfloor n\left(1-x\right)\rfloor}{ \binom{n}{j} \left(\frac{j}{n}+x\right)^{j-1}\left(1 - x - \frac{j}{n}\right)^{n-j}} また、whuber sezは、この1つのサンプルのCDFのわずかに異なる定式化があります(ここでの表記との整合性を保つために、彼の引用のtをxxxに置き換えています)。ttt 確率積分変換を使用して、ドナルドクヌースはpでの(共通の)分布を導出します。TAoCP Volume 2の57とエクササイズ17 。 (D+n≤xn−−√)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1(Dn+≤xn)=xnn∑c≤k≤x(nk)(k−x)k(x+n−k)n−k−1\left(D^{+}_{n}\le \frac{x}{\sqrt{n}}\right)=\frac{x}{n^{n}}\sum_{c\le k\le x}\binom{n}{k}\left(k-x\right)^{k}\left(x+n-k\right)^{n-k-1} H:これは、以下のような1サンプルの場合における片側仮説に適用される0: F (X )- F 0 ≤ 0、F (xは)の経験的CDFであり、X、およびF 0は、いくつかのCDFです。0: F(x)−F0≤00: …

2
ブートストラップ標本の標本平均の分散
ましょは別個の観測値です(関係なし)。ましょX * 1、。。。、X * n個のブートストラップ標本(経験的CDFからのサンプル)を示すとせˉ X * N = 1X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}。検索E( ˉ X * N)とVR( ˉ X * Nを)。X¯∗n=1n∑ni=1X∗iX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯∗n)E(X¯n∗)E(\bar{X}_{n}^{*})Var(X¯∗n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) これまでのところ、はX 1、です。。。、X nそれぞれ確率1X∗iXi∗X_{i}^{*}X1,...,XnX1,...,XnX_{1},...,X_{n}したがって E(X ∗ i)=11n1n\frac{1}{n}および E(X ∗ 2 i)=1E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu 与える VをR(X * I)= E (X * 2 I)- (E (X * I))2 = μ 2 + σ 2 - μ …

2
ドリフトを伴うランダムウォークの最大ドローダウンの累積分布を計算する
ランダムウォークの最大ドローダウンの分布に興味がありますここで、。期間後の最大ドローダウンはです。Magdon-Ismail らによる論文。al。ドリフトを伴うブラウン運動の最大ドローダウンの分布を与えます。式には、暗黙的にのみ定義されたいくつかの項を含む無限和が含まれます。収束する実装の記述に問題があります。CDFの代替表現やコードのリファレンス実装を知っている人はいますか?X0=0,Xi+1=Xi+Yi+1X0=0,Xi+1=Xi+Yi+1X_0 = 0, X_{i+1} = X_i + Y_{i+1}Yi∼N(μ,1)Yi∼N(μ,1)Y_i \sim \mathcal{N}(\mu,1)nnnmax0≤i≤j≤n(Xi−Xj)max0≤i≤j≤n(Xi−Xj)\max_{0 \le i \le j \le n} (X_i - X_j)

1
CDFが厳密に増加していると仮定せずに確率積分変換を証明する
このサイトでは、確率積分変換の証明が複数回行われていることを知っています。しかし、私が見つけた証明はCDFがFX(x)FX(x)F_X(x) 厳密に増加しています(もちろん、一緒に、 XXXは連続確率変数です)。実際に必要な唯一の仮説はXXXは連続確率変数であり、厳密な単調性は必要ありません。方法を教えてください。 私はすでにここにいるので、機会に確率積分変換の簡単な適用を依頼することもできます:) XXX CDFあり FX(x)FX(x)F_X(x) そして YYY の切り捨てです XXX に [a,b][a,b][a,b]、その後 YYY として配布されます F−1X(U)FX−1(U)F_X^{-1}(U) どこ U∼[FX(a),FX(b)]U∼[FX(a),FX(b)]U\sim[F_X(a),F_X(b)]?

1
打ち切られた混合正規分布からシミュレーション
次のような混合正規分布からサンプルをシミュレートしたい p × N(μ1、σ21)+ (1 − p )× N(μ2、σ22)p×N(μ1,σ12)+(1−p)×N(μ2,σ22)p\times\mathcal{N}(\mu_1,\sigma_1^2) + (1-p)\times\mathcal{N}(\mu_2,\sigma_2^2) 間隔に制限されているの代わりに、R。これは、正規分布の切り捨てられた混合をシミュレートしたいということです。[ 0 、1 ][0,1][0,1]RR\mathbb{R} これを行うために、切り捨てられた法線をシミュレートするアルゴリズム(つまり、この質問から)と対応するパッケージがRにあることを知っています。しかし、切り捨てられた混合法線をどうやってシミュレートできますか?それは私が2が通常の切り捨てシミュレート場合と同じであるとN(μ 2、σ 2 2切り捨てられた混合物を通常にしますか)?N(μ1、σ21)N(μ1,σ12)\mathcal{N}(\mu_1,\sigma_1^2)N(μ2、σ22N(μ2,σ22\mathcal{N}(\mu_2,\sigma_2^2

1
Irwin-Hall分布をより一般的にすることはできますか?
均一な、尖った、正規のガウス分布を含む、対称性の低い尖度分布クラスを見つける必要があります。Irwin-Hall分布(標準のユニフォームの合計)はこの特性を提供しますが、非整数次数扱いません。ただし、たとえば2つの標準的なユニフォームと1つの3rdをような小さい範囲で単純に独立して合計すると、実際には任意の任意の次数(この場合はように)。しかし、CDFの実用的な閉じた式を見つけることは可能ですか?[ 0 、1 ] [ 0 、0.25 ] N = 2.25NNN[0,1][0,1][0,1][0,0.25][0,0.25][0,0.25]N=2.25N=2.25N=2.25

2
極限
限界を示すことについて疑問に思っています: where \ overline {F} = 1-F is a tail distribution function、\ overline {F} (x)= 1−F(x)、ここでFは累積分布関数です ¯ F =1-F ¯ F(X)=1-F(X)Flimx→∞xF¯¯¯¯(x)=0limx→∞xF¯(x)=0 \lim_{x \to \infty} x\overline{F}(x) =0 F¯¯¯¯=1−FF¯=1−F\overline{F} =1-FF¯¯¯¯(x)=1−F(x)F¯(x)=1−F(x)\overline{F}(x)=1−F(x)FFF x→∞x→∞x \to \infty、F¯¯¯¯→0F¯→0\overline{F} \to 0:我々は不定形を有するので、私は書き換え limx→∞F¯¯¯¯(x)1/xlimx→∞F¯(x)1/x \lim_{x \to \infty} \frac{\overline{F}(x)}{1/x} 及び使用ロピタルの定理: limx→∞f(x)1/x2limx→∞f(x)1/x2 \lim_{x \to \infty} \frac{f(x)}{1/x^2} が、これはの知識が必要fffとしてx→∞x→∞x \to \infty私はありません持ってる。 この制限を評価するにはどうすればよいですか?

1
条件付き確率の導出で起こり得る間違い
以下は、私が現在研究している論文からの密度の導出です。品質が悪いため申し訳ありませんが、それはかなり古い紙です。私はそれを明確にする必要内標準指数密度有する(0 、∞ )、Uは上に均一である(0 、1 )それらが独立しています。もちろん、人口相関係数ρは定数です。XとYは、標準の2変量正規分布、つまり三角法の表現に由来しますが、これはここでは何の役割も果たしていないと思います。RRR(0 、∞ )(0,∞)(0,\infty)UUU(0 、1 )(0,1)(0,1)ρρ\rhoバツXXYYY 私が理解していないのは、著者が正または負のについてこれらの結論に到達する方法です。負の数による除算とRの非負性は適切に考慮されていないように思えます。もちろん間違えることもありますので、アドバイスをいただければ幸いです。ありがとうございました。tttRRR

3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph &lt;- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

3
分布の分析形式が不明な場合の変位値関数の取得方法
問題は、この[0]論文の377〜379ページにあります。 連続分布と固定与えられた場合、以下を考慮してください:FFFz∈Rz∈Rz\in\mathbb{R} Lz(t)=PF(|z−Z|≤t)Lz(t)=PF(|z−Z|≤t)L_z(t)=P_F(|z-Z|\leq t) そして H(z)=L−1z(0.5)=medZ∼F|z−Z|H(z)=Lz−1(0.5)=medZ∼F|z−Z|H(z)=L^{-1}_z(0.5)=\underset{Z\sim F}{\mbox{med}}|z-Z| ここで、は正しい連続逆行列です。したがって、固定zの場合、これはすべてのZ \ sim Fからzまでの距離の中央値です 。次に、関数について考えます。zL−1z(u)=inf{t:Lz(t)&gt;u}Lz−1(u)=inf{t:Lz(t)&gt;u}L^{-1}_z(u)=\inf\{t:L_z(t)>u\}zzzZZ∼FZ∼FZ\sim Fzzz L(t)=PF(H(Z)≤t)L(t)=PF(H(Z)≤t)L(t)=P_F(H(Z)\leq t) 今、私はH(z)の分析式を持っていませんH(z)H(z)H(z)(実際、そのための分析式は不可能だと確信しています)が、CDF Fが与えられればFFF、ルート探索アルゴリズムを使用してH(z)H(z)H(z)任意のzzz。 このアプリケーションでは、興味があります: L−1(0.5)=medZ∼FH(Z)L−1(0.5)=medZ∼FH(Z)L^{-1}(0.5)=\underset{Z\sim F}{\mbox{med}}H(Z) これは、中央値であるH(Z)H(Z)H(Z)のために、再度、Z∼FZ∼FZ\sim F。 を取得するために、グリッド上で多くの値に対応する値をルート検索アルゴリズムを使用して上記で説明したように)計算し、これらの値の重み付き中央値を取ります推定値としての(重み付き。H (z )z H (z )f (z )L − 1(0.5 )L−1(0.5)L−1(0.5)L^{-1}(0.5)H(z)H(z)H(z)zzzH(z)H(z)H(z)f(z)f(z)f(z)L−1(0.5)L−1(0.5)L^{-1}(0.5) 私の質問は: を取得するためのより正確な方法はありますか(この論文の執筆者は、計算方法を述べていません)L − 1(0.5 )L−1(0.5)L−1(0.5)L^{-1}(0.5)L−1(0.5)L−1(0.5)L^{-1}(0.5) の値のグリッドはどのように選択する必要がありますか?zzz [0] OlaHössjer、Peter J. Rousseeuw、Christophe Croux。ロバストなスプレッド汎関数の推定量の漸近。Statistica Sinica 6(1996)、375-388。



弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.