タグ付けされた質問 「cdf」

累積分布関数。PDFは確率変数の各値の確率密度を示しますが、CDF(多くの場合、Fバツ)確率変数が指定された値以下になる確率を与えます。

3
CDFはPDFよりも基本的ですか?
私の統計学教授は基本的に、次の3つのうちの1つが与えられた場合、他の2つを見つけることができると言いました。 累積分布関数 モーメント生成機能 確率密度関数 しかし、私の計量経済学の教授は、CDFはPDFよりも基本的であると言いました。なぜなら、CDFを持つことはできてもPDFが定義されていない例があるからです。 CDFはPDFよりも基本的ですか?PDFまたはMGFがCDFから派生できるかどうかを知るにはどうすればよいですか?
43 probability  pdf  cdf  mgf 

10
なぜ2つのランダム変数の合計が畳み込みなのですか?
長い間、2つの確率変数の「合計」が畳み込みである理由を理解できませんでしたが、と混合密度関数の合計はf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); 畳み込みではなく算術和。「2つのランダム変数の合計」というフレーズは、googleで146,000回表示され、次のように楕円形です。RVが単一の値を生成すると考える場合、その単一の値を別のRVの単一の値に追加できます。これは、少なくとも直接ではなく、畳み込みとは関係ありません。それは2つの数値の合計です。ただし、統計のRV結果は値の集合であるため、より正確なフレーズは「2つのRVからの関連する個々の値のペアの調整された合計のセットは離散畳み込み」のようになり、...それらのRVに対応する密度関数の畳み込み。さらに単純な言語: 2 RVnnn-サンプルは、事実上、ベクトルの合計として加算される2つのn次元ベクトルです。 2つのランダム変数の合計が畳み込みと合計である方法の詳細を示してください。

3
ガウス比分布:およびの基礎となるデリバティブ
平均と、分散と 2つの独立した正規分布とます。XXXYYYμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y それらの比率の分布に興味があります。どちらやので、ゼロの平均値を有し、Zはコーシーとして配布されていません。Z=X/YZ=X/YZ=X/YXXXYYYZZZ ZのCDFを見つけてZZZから、μxμx\mu_x、μyμy\mu_y、σ2xσx2\sigma^2_xおよび\ sigma ^ 2_yに関するCDFの導関数を取得する必要がありますσ2yσy2\sigma^2_y。 これらがすでに計算されている論文を知っている人はいますか?または、これを自分で行う方法は? 1969年の論文でCDFの式を見つけましたが、これらの派生物を取得することは間違いなく大きな苦痛です。誰かがすでにそれを行っているか、簡単に行う方法を知っているのでしょうか?私は主にこれらのデリバティブの兆候を知る必要があります。 このペーパーには、YYYがほとんど正の場合の分析的に単純な近似も含まれています。私はその制限を持つことはできません。ただし、パラメータ範囲外であっても、近似値は真の導関数と同じ符号を持つ可能性がありますか?

2
分位(逆CDF)関数の理解を手伝ってください
分位数関数について読んでいますが、はっきりしていません。以下に示す説明よりも直感的な説明を提供できますか? cdfは単調増加関数であるため、逆関数になります。これを示しましょう。場合の累積分布関数であるは、の値であるように、。これは分位数と呼ばれます。値は分布の中央値で、確率質量の半分が左側に、半分が右側にあります。値 およびは、下位および上位の四分位数です。F - 1 F X F - 1(α )X α P (X ≤ X α)= α α F F - 1(0.5 )F - 1(0.25 )F - 1(0.75 )FFFF−1F−1F^{−1}FFFバツXXF− 1(α )F−1(α)F^{−1}(\alpha)バツαxαx_\alphaP(X≤ Xα)= αP(X≤xα)=αP(X \le x_\alpha) = \alphaαα\alphaFFFF− 1(0.5 )F−1(0.5)F^{−1}(0.5)F− 1(0.25 )F−1(0.25)F^{−1}(0.25)F− 1(0.75 )F−1(0.75)F^{−1}(0.75)

4
Rの累積分布を計算する方法は?
ロックされています。この質問とその回答はロックされています。なぜなら、質問はトピックから外れていますが、歴史的に重要だからです。現在、新しい回答やインタラクションを受け入れていません。 データサンプルの累積分布関数を計算する必要があります。 累積密度関数を測定するRのhist()に似たものはありますか? 私はecdf()を試しましたが、ロジックを理解できません。
23 r  distributions  cdf 


5
経験的CDFとCDF
経験累積分布関数について学んでいます。しかし、私はまだ理解していません なぜ「経験的」と呼ばれるのですか? Empirical CDFとCDFに違いはありますか?


2
サンプルのCDFが均一に分布している理由
ここで、cdfを使用した連続分布からのサンプルが与えられ、対応するサンプルが標準的な均一分布に従うことを読みました。X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) Pythonの定性シミュレーションを使用してこれを検証しましたが、関係を簡単に検証できました。 import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)") 結果は次のプロットになります。 これがなぜ起こるのか理解できません。私はそれがCDFの定義とPDFとの関係に関係していると思いますが、何かが欠けています... 誰かが私にその主題に関するいくつかの読書を教えてくれたり、私が主題に関するいくつかの直観をつかむのを手伝ってくれたりしていただければ幸いです。 編集:CDFは次のようになります。
17 pdf  uniform  cdf  intuition 

3
pdfとpmfとcdfには同じ情報が含まれていますか?
pdfとpmfとcdfには同じ情報が含まれていますか? 私にとって、pdfは特定のポイント(基本的には確率の下の領域)に確率全体を与えます。 pmfは、特定のポイントの確率を示します。 cdfは、特定のポイントの下での確率を​​示します。 だから私にはpdfとcdfは同じ情報を持っていますが、pmfはx分布上の点の確率を与えるのでそうではありません。

1
Rの密度関数から確率密度関数を見つける/推定する方法
X分布が不明なような変数があるとします。Mathematicaでは、SmoothKernelDensity関数を使用して推定密度関数を得ることができます。この推定密度関数は、「密度」がの結果であると仮定する形式のPDFような値の確率密度関数を計算する関数とともに使用できます。Rにそのような機能があれば良いでしょう。これがMathematicaでの動作です。XPDF[density,X]SmoothKernelDensity http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html 例として(Mathematica関数に基づいて): data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1) density= SmoothKernelDistribution[data]; #estimated density PDF[density, 2.345] returns 0.0588784 ここでは、PDFに関する詳細情報を見つけることができます。 http://reference.wolfram.com/mathematica/ref/PDF.html density(X)Rを使用して密度関数をプロットでき、その使用によりecdf(X)経験的累積分布関数を取得できることを知っていますが、Mathematicaについて説明した内容に基づいてRで同じことを行うことは可能ですか? どんな助けとアイデアも大歓迎です。
17 r  pdf  cdf 

4
どちらを信じるべきか:コルモゴロフ-スミルノフ検定またはQQプロット?
連続データのデータセットがパラメーターshape 1.7およびrate 0.000063のガンマ分布に従うかどうかを判断しようとしています。====== 問題は、Rを使用してデータセット QQプロットを作成するxxxして、理論的な分布ガンマ(1.7、0.000063)に対すると、経験データがガンマ分布とほぼ一致することを示すプロットが得られることです。ECDFプロットでも同じことが起こります。 私はコルモゴロフ-スミルノフ検定を実行するときしかし、それは私に不当に小さな与えの-値&lt; 1 %に。ppp&lt;1%&lt;1%<1\% どちらを信じるべきですか?グラフィック出力またはKSテストからの結果?

3
CDFは力を上げましたか?
FZFZF_ZがCDFの場合、()もCDFのように見えます。 α &gt; 0FZ(z)αFZ(z)αF_Z(z)^\alphaα&gt;0α&gt;0\alpha \gt 0 Q:これは標準的な結果ですか? Q:関数を見つけるための良い方法があると ST、X ≡ G (Z )gggX≡g(Z)X≡g(Z)X \equiv g(Z)FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alphax≡g(z)x≡g(z) x \equiv g(z) 基本的に、という別のCDFを手にしています。いくつかの縮小された形式の意味で、そのCDFを生成するランダム変数を特徴付けたいと思います。FZ(z)αFZ(z)αF_Z(z)^\alpha 編集:特殊なケース分析結果が得られれば幸いです。または、少なくとも、そのような結果は扱いにくいことを知っています。Z∼N(0,1)Z∼N(0,1)Z \sim N(0,1)

1
キャレットglmnetとcv.glmnet
glmnetwithin caretを使用して最適なラムダを検索cv.glmnetし、同じタスクを実行するために使用することの比較には、多くの混乱があるようです。 次のような多くの質問が提起されました。 分類モデルtrain.glmnet対cv.glmnet? キャレットでglmnetを使用する適切な方法は何ですか? 「キャレット」を使用して「glmnet」を相互検証する しかし、答えはありません。これは、質問の再現性による可能性があります。最初の質問に続いて、非常に似た例を挙げますが、同じ質問があります:推定されるラムダはなぜそんなに違うのですか? library(caret) library(glmnet) set.seed(849) training &lt;- twoClassSim(50, linearVars = 2) set.seed(849) testing &lt;- twoClassSim(500, linearVars = 2) trainX &lt;- training[, -ncol(training)] testX &lt;- testing[, -ncol(testing)] trainY &lt;- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = …


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.