統計とビッグデータ cdf

3

私の統計学教授は基本的に、次の3つのうちの1つが与えられた場合、他の2つを見つけることができると言いました。累積分布関数モーメント生成機能確率密度関数しかし、私の計量経済学の教授は、CDFはPDFよりも基本的であると言いました。なぜなら、CDFを持つことはできてもPDFが定義されていない例があるからです。 CDFはPDFよりも基本的ですか？PDFまたはMGFがCDFから派生できるかどうかを知るにはどうすればよいですか？

43 probability pdf cdf mgf

10

なぜ2つのランダム変数の合計が畳み込みなのですか？

長い間、2つの確率変数の「合計」が畳み込みである理由を理解できませんでしたが、と混合密度関数の合計はf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); 畳み込みではなく算術和。「2つのランダム変数の合計」というフレーズは、googleで146,000回表示され、次のように楕円形です。RVが単一の値を生成すると考える場合、その単一の値を別のRVの単一の値に追加できます。これは、少なくとも直接ではなく、畳み込みとは関係ありません。それは2つの数値の合計です。ただし、統計のRV結果は値の集合であるため、より正確なフレーズは「2つのRVからの関連する個々の値のペアの調整された合計のセットは離散畳み込み」のようになり、...それらのRVに対応する密度関数の畳み込み。さらに単純な言語： 2 RVnnn-サンプルは、事実上、ベクトルの合計として加算される2つのn次元ベクトルです。 2つのランダム変数の合計が畳み込みと合計である方法の詳細を示してください。

33 pdf terminology cdf mixture convolution

3

ガウス比分布：およびの基礎となるデリバティブ

平均と、分散と 2つの独立した正規分布とます。XXXYYYμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y それらの比率の分布に興味があります。どちらやので、ゼロの平均値を有し、Zはコーシーとして配布されていません。Z=X/YZ=X/YZ=X/YXXXYYYZZZ ZのCDFを見つけてZZZから、μxμx\mu_x、μyμy\mu_y、σ2xσx2\sigma^2_xおよび\ sigma ^ 2_yに関するCDFの導関数を取得する必要がありますσ2yσy2\sigma^2_y。これらがすでに計算されている論文を知っている人はいますか？または、これを自分で行う方法は？ 1969年の論文でCDFの式を見つけましたが、これらの派生物を取得することは間違いなく大きな苦痛です。誰かがすでにそれを行っているか、簡単に行う方法を知っているのでしょうか？私は主にこれらのデリバティブの兆候を知る必要があります。このペーパーには、YYYがほとんど正の場合の分析的に単純な近似も含まれています。私はその制限を持つことはできません。ただし、パラメータ範囲外であっても、近似値は真の導関数と同じ符号を持つ可能性がありますか？

28 distributions normal-distribution references mathematical-statistics cdf

2

分位（逆CDF）関数の理解を手伝ってください

分位数関数について読んでいますが、はっきりしていません。以下に示す説明よりも直感的な説明を提供できますか？ cdfは単調増加関数であるため、逆関数になります。これを示しましょう。場合の累積分布関数であるは、の値であるように、。これは分位数と呼ばれます。値は分布の中央値で、確率質量の半分が左側に、半分が右側にあります。値およびは、下位および上位の四分位数です。F - 1 F X F - 1（α ）X α P （X ≤ X α）= α α F F - 1（0.5 ）F - 1（0.25 ）F - 1（0.75 ）FFFF−1F−1F^{−1}FFFバツXXF− 1（α ）F−1(α)F^{−1}(\alpha)バツαxαx_\alphaP（X≤ Xα）= αP(X≤xα)=αP(X \le x_\alpha) = \alphaαα\alphaFFFF− 1（0.5 ）F−1(0.5)F^{−1}(0.5)F− 1（0.25 ）F−1(0.25)F^{−1}(0.25)F− 1（0.75 ）F−1(0.75)F^{−1}(0.75)

25 distributions cdf inverse-cdf quantile-function

4

Rの累積分布を計算する方法は？

ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。データサンプルの累積分布関数を計算する必要があります。累積密度関数を測定するRのhist（）に似たものはありますか？私はecdf（）を試しましたが、ロジックを理解できません。

23 r distributions cdf

3

CDFを指定してPDFを見つける

CDF（累積分布関数）が与えられた分布のPDF（確率密度関数）を見つけるにはどうすればよいですか？

23 distributions pdf cdf

5

経験的CDFとCDF

経験累積分布関数について学んでいます。しかし、私はまだ理解していませんなぜ「経験的」と呼ばれるのですか？ Empirical CDFとCDFに違いはありますか？

20 distributions terminology cdf ecdf

3

累積分布関数（CDF）が分布を一意に定義するのはなぜですか？

私は常にCDFは一意であると言われていますが、PDF / PMFは一意ではありません。なぜですか？PDF / PMFが一意ではない例を挙げていただけますか？

17 probability distributions pdf cdf

2

サンプルのCDFが均一に分布している理由

ここで、cdfを使用した連続分布からのサンプルが与えられ、対応するサンプルが標準的な均一分布に従うことを読みました。X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) Pythonの定性シミュレーションを使用してこれを検証しましたが、関係を簡単に検証できました。 import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)") 結果は次のプロットになります。これがなぜ起こるのか理解できません。私はそれがCDFの定義とPDFとの関係に関係していると思いますが、何かが欠けています... 誰かが私にその主題に関するいくつかの読書を教えてくれたり、私が主題に関するいくつかの直観をつかむのを手伝ってくれたりしていただければ幸いです。編集：CDFは次のようになります。

17 pdf uniform cdf intuition

3

pdfとpmfとcdfには同じ情報が含まれていますか？

pdfとpmfとcdfには同じ情報が含まれていますか？私にとって、pdfは特定のポイント（基本的には確率の下の領域）に確率全体を与えます。 pmfは、特定のポイントの確率を示します。 cdfは、特定のポイントの下での確率を示します。だから私にはpdfとcdfは同じ情報を持っていますが、pmfはx分布上の点の確率を与えるのでそうではありません。

17 probability distributions pdf inference cdf

1

Rの密度関数から確率密度関数を見つける/推定する方法

X分布が不明なような変数があるとします。Mathematicaでは、SmoothKernelDensity関数を使用して推定密度関数を得ることができます。この推定密度関数は、「密度」がの結果であると仮定する形式のPDFような値の確率密度関数を計算する関数とともに使用できます。Rにそのような機能があれば良いでしょう。これがMathematicaでの動作です。XPDF[density,X]SmoothKernelDensity http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html 例として（Mathematica関数に基づいて）： data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1) density= SmoothKernelDistribution[data]; #estimated density PDF[density, 2.345] returns 0.0588784 ここでは、PDFに関する詳細情報を見つけることができます。 http://reference.wolfram.com/mathematica/ref/PDF.html density(X)Rを使用して密度関数をプロットでき、その使用によりecdf(X)経験的累積分布関数を取得できることを知っていますが、Mathematicaについて説明した内容に基づいてRで同じことを行うことは可能ですか？どんな助けとアイデアも大歓迎です。

17 r pdf cdf

4

どちらを信じるべきか：コルモゴロフ-スミルノフ検定またはQQプロット？

連続データのデータセットがパラメーターshape 1.7およびrate 0.000063のガンマ分布に従うかどうかを判断しようとしています。====== 問題は、Rを使用してデータセット QQプロットを作成するxxxして、理論的な分布ガンマ（1.7、0.000063）に対すると、経験データがガンマ分布とほぼ一致することを示すプロットが得られることです。ECDFプロットでも同じことが起こります。私はコルモゴロフ-スミルノフ検定を実行するときしかし、それは私に不当に小さな与えの-値< 1 ％に。ppp<1%<1%<1\% どちらを信じるべきですか？グラフィック出力またはKSテストからの結果？

16 pdf kolmogorov-smirnov cdf qq-plot

3

CDFは力を上げましたか？

FZFZF_ZがCDFの場合、（）もCDFのように見えます。 α > 0FZ(z)αFZ(z)αF_Z(z)^\alphaα>0α>0\alpha \gt 0 Q：これは標準的な結果ですか？ Q：関数を見つけるための良い方法があると ST、X ≡ G （Z ）gggX≡g(Z)X≡g(Z)X \equiv g(Z)FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alphax≡g(z)x≡g(z) x \equiv g(z) 基本的に、という別のCDFを手にしています。いくつかの縮小された形式の意味で、そのCDFを生成するランダム変数を特徴付けたいと思います。FZ(z)αFZ(z)αF_Z(z)^\alpha 編集：特殊なケース分析結果が得られれば幸いです。または、少なくとも、そのような結果は扱いにくいことを知っています。Z∼N(0,1)Z∼N(0,1)Z \sim N(0,1)

15 data-transformation cdf quantile-function

1

キャレットglmnetとcv.glmnet

glmnetwithin caretを使用して最適なラムダを検索cv.glmnetし、同じタスクを実行するために使用することの比較には、多くの混乱があるようです。次のような多くの質問が提起されました。分類モデルtrain.glmnet対cv.glmnet？キャレットでglmnetを使用する適切な方法は何ですか？「キャレット」を使用して「glmnet」を相互検証するしかし、答えはありません。これは、質問の再現性による可能性があります。最初の質問に続いて、非常に似た例を挙げますが、同じ質問があります：推定されるラムダはなぜそんなに違うのですか？ library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = …

14 r caret glmnet machine-learning neural-networks maximum softmax probability distributions mathematical-statistics random-variable cdf statistical-significance variance expected-value ratio sample-size reliability tolerance-interval wilcoxon-signed-rank self-study variance sampling mean machine-learning svm libsvm self-study sampling ranks data-visualization histogram machine-learning classification normal-distribution mathematical-statistics maximum-likelihood mixture predictive-models prediction seasonality

1

エラー関数と標準正規分布関数はどのように関連していますか？

標準標準PDFがf（x ）= 12個のπ−−√e− x2/ 2f(x)=12πe−x2/2f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} そしてCDFは F（x ）= 12個のπ−−√∫バツ- ∞e− x2/ 2d x、F(x)=12π∫−∞xe−x2/2dx,F(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-x^2/2}\mathrm{d}x\,, これはどのようにして誤差関数に変わるのですか？zzz

10 normal-distribution cdf

タグ付けされた質問 「cdf」

タグ付けされた質問「cdf」