タグ付けされた質問 「ecdf」

7
分布仮説のテスト-帰無仮説を「受け入れる」ことができない場合、それを行う意味は何ですか?
GOF検定、Kolmogorov-Smirnov、Anderson-Darling などのさまざまな仮説検定は、次の基本形式に従います。χ2χ2\chi^{2} H0H0H_0:データは指定された分布に従います。 H1H1H_1:データは指定された分布に従っていません。 通常、特定のデータが特定の分布に従っているという主張を評価し、拒否した場合、データは特定のレベルでの特定の分布に適合しません。 αH0H0H_0αα\alpha しかし、拒否しないとますか?私は常に「受け入れる」ことはできないと教えられてきたので、基本的にを拒否する証拠はありません。つまり、データが指定された分布に従うことを拒否するという証拠はありません。H 0 H 0H0H0H_0H0H0H_0H0H0H_0 したがって、私の質問は、データが特定の分布に従うかどうかを結論付けることができない場合、そのようなテストを実行するポイントは何ですか?

5
経験的CDFとCDF
経験累積分布関数について学んでいます。しかし、私はまだ理解していません なぜ「経験的」と呼ばれるのですか? Empirical CDFとCDFに違いはありますか?

1
経験的CDFの統合
経験的分布G(x)G(x)G(x)ます。次のように計算します x <- seq(0, 1000, 0.1) g <- ecdf(var1) G <- g(x) 私はh(x)=dG/dxh(x)=dG/dxh(x) = dG/dx。つまり、hhhはpdfで、GGGはcdfです。 私は今(と言う統合の上限のための方程式を解決したいの期待値というように、)xはいくつかあるのk。aaaxxxkkk それから、積分、ある000にbbb、私が持っているべきである∫xh(x)dx=k∫xh(x)dx=k\int xh(x)dx = k。について解きたいbbb。 部品ごとに統合して、方程式を次のように書き換えることができます。 bG(b)−∫b0G(x)dx=kbG(b)−∫0bG(x)dx=kbG(b) - \int_0^b G(x)dx = k積分はあり、000にbbb -------(1) 次のように積分を計算できると思います intgrl <- function(b) { z <- seq(0, b, 0.01) G <- g(z) return(mean(G)) } しかし、この関数を使用しようとすると library(rootSolve) root <- uniroot.All(fun, c(0, 1000)) …
13 r  integral  ecdf 

1
ecdfが線形補間ではなくステップ関数を使用するのはなぜですか?
経験的CDF関数は通常、ステップ関数によって推定されます。これが線形補間を使用するのではなく、そのような方法で行われる理由はありますか?ステップ関数には、それを好む興味深い理論上の特性がありますか? 次に2つの例を示します。 ecdf2 <- function (x) { x <- sort(x) n <- length(x) if (n < 1) stop("'x' must have 1 or more non-missing values") vals <- unique(x) rval <- approxfun(vals, cumsum(tabulate(match(x, vals)))/n, method = "linear", yleft = 0, yright = 1, f = 0, ties = "ordered") class(rval) <- …
12 r  distributions  ecdf 

2
経験的分布の代替
賞金: 完全な恵みを推定言及用途または任意の発表された論文への参照を提供誰かに授与されますF~F~\tilde{F}以下を。 動機: このセクションはおそらくあなたにとって重要ではなく、あなたが報奨金を得るのに役立たないと思いますが、誰かが動機について尋ねたので、ここで私が取り組んでいるものがあります。 統計グラフ理論の問題に取り組んでいます。標準の密集グラフ制限オブジェクトW:[0,1]2→[0,1]W:[0,1]2→[0,1]W : [0,1]^2 \to [0,1]の意味での対称関数であるW(u,v)=W(v,u)W(u,v)=W(v,u)W(u,v) = W(v,u)。上のグラフサンプリングnnn頂点がサンプリングと考えることができるnnn(単位区間上に均一な値UiUiU_iためにi=1,…,ni=1,…,ni = 1, \dots, n)、次いで、エッジの確率(i,j)(i,j)(i,j)であるW(Ui,Uj)W(Ui,Uj)W(U_i, U_j)。結果の隣接行列をAと呼びますAAAます。 我々は扱うことができWWW密度としてf=W/∬Wf=W/∬Wf = W / \iint Wと仮定∬W&gt;0∬W&gt;0\iint W > 0。我々は推定した場合fffに基づいてAAAへの制約を受けることなくfff、我々は一貫性の推定値を得ることができません。fが制約付きの可能な関数のセットに由来する場合、一貫して推定することに関する興味深い結果を見つけました。この推定量と∑ Aから、Wを推定できます。ffffff∑A∑A\sum AWWW 残念ながら、私が見つけた方法は、密度分布からサンプリングしたときに一貫性を示していfffます。AAA構築方法では、ポイントのグリッドをサンプリングする必要があります(元のから描画するのとは対照的fffです)。このstats.SEの質問では、実際に分布から直接サンプリングするのではなく、このようなグリッドでサンプルベルヌーイのみをサンプリングできる場合に何が起こるかという1次元(より単純な)問題を求めています。 グラフの制限の参照: L.ロバスツとB.セゲディ。密なグラフシーケンスの制限(arxiv)。 C.ボルグス、J。チェイス、L。ロバスツ、V。ソス、K。ヴェステルゴンビ。密なグラフの収束シーケンスi:サブグラフの頻度、メトリックプロパティ、およびテスト。(arxiv)。 表記: CDFと連続分布検討FFFおよびPDF fff区間に正サポートしている[0,1][0,1][0,1]。仮定fffないpointmassを有していない、FFFどこでも微分可能であり、また、そのsupz∈[0,1]f(z)=c&lt;∞supz∈[0,1]f(z)=c&lt;∞\sup_{z \in [0,1]} f(z) = c < \inftyのsupremumあるfff区間に[0,1][0,1][0,1]。ましょXX∼FX∼FX \sim F確率変数という意味XXXは、分布からサンプリングされFFFます。 UiUiU_iオンIID一様ランダム変数である[0,1][0,1][0,1]。 問題のセットアップ: 多くの場合、X1,…,XnX1,…,XnX_1, \dots, X_nを分布ランダム変数とFFFし、通常の経験分布関数として F N(T …



3
分布を見つけて正規分布に変換する
1時間にイベントが発生する頻度(「1時間あたりの数」、nph)とイベントが持続する時間(「1秒あたりの秒数」、dph)を説明するデータがあります。 これは元のデータです: nph &lt;- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, 15.3750000002237, NA, 6.00000000004109, 9.71428571436649, 12.4848484848485, 16.5034965037115, 20.6666666666667, 3.49999999997453, 4.65882352938624, 4.74999999996544, 3.99999999994522, 2.8, 14.2285714286188, 11.0000000000915, NA, 2.66666666666667, 3.76470588230138, 4.70588235287673, 13.2727272728677, 2.0000000000137, 18.4444444444444, 17.5555555555556, 14.2222222222222, 2.00000000001663, 4, 8.46153846146269, 19.2000000001788, 13.9024390245481, 13, 3.00000000004366, NA, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.