タグ付けされた質問 「qq-plot」

qqプロット(または変位値変位値プロット)は、2つの分布の変位値の散布図です。QQプロットは、分布の比較に役立ちます。

2
QQプロットがヒストグラムと一致しません
ヒストグラム、カーネル密度、財務ログリターンの近似正規分布があり、これらは損失に変換されます(符号が変更されます)。これらのデータの通常のQQプロットがあります。 QQプロットは、テールが正しく適合していないことを明確に示しています。しかし、ヒストグラムと適合した正規分布(青)を見ると、0.0付近の値でも正しく適合していません。そのため、QQプロットは、テールのみが適切に適合していないことを示していますが、明らかに分布全体が正しく適合していないことを示しています。QQプロットに表示されないのはなぜですか?

2
QQプロットの解釈
次のコードと出力を検討してください。 par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") 対数正規のQQプロットは、ワイブルのQQプロットとほとんど同じであるようです。それらをどのように区別できますか?また、ポイントが2つの外側の黒い線で定義された領域内にある場合、それらは指定された分布に従うことを示していますか?

1
このサンプルの(対数)正規性を仮定できますか?
これが私のサンプルのQQプロットです(対数Y軸に注意してください)。:n = 1000n=1000n = 1000 whuberによって指摘されたように、これは、基になる分布が左に歪んでいる(右裾が短い)ことを示しています。 用いたshapiro.test(対数変換データ)Rで、Iは、検定統計量取得及びp値我々は正式ことを意味する、リジェクトヌル仮説 95%の信頼水準で。5.172 ⋅ 10 - 13 H 0:サンプルは正常に分布されていますW= 0.9718W=0.9718W = 0.97185.172 ⋅ 10− 135.172⋅10−135.172\cdot10^{-13}H0:サンプルは正規分布ですH0:the sample is normal distributedH_0 : \text{the sample is normal distributed} 私の質問は次のとおりです。これは、(対数)正規性を前提としたさらなる分析のために実際には十分ですか?特に、CoxとLandによる近似法を使用して、類似したサンプルの平均の信頼区間を計算したいと思います(論文で説明されている:Zou、GY、cindy Yan HuoおよびTaleban、J。(2009)。単純な信頼区間対数正規平均と、環境アプリケーションとの違い。Environmetrics20、172–180): ci <- function (x) { y <- log(x) n <- length(y) s2 <- var(y) m <- mean(y) …

3
ggplot2を使用して2つのデータセットをQQプロットと比較する方法は?
統計とRの初心者の両方として、私は1:1のアスペクト比でqqplotを生成しようとするのに本当に苦労しています。ggplot2は、デフォルトのRプロットパッケージよりもはるかに多くのコントロールを提供しているようですが、2つのデータセットを比較するためにggplot2でqqplotを実行する方法がわかりません。 だから私の質問、ggplot2の同等のものは何ですか? qqplot(datset1,dataset2)

3
歪んだデータによる回帰
ユーザー属性とサービスから訪問数を計算しようとしています。データは非常に歪んでいます。 ヒストグラム: qqプロット(左は対数): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityとservice因子変数です。 すべての変数で低いp値***が得られますが、rの2乗が.05と低くなっています。私は何をすべきか?指数関数などの別のモデルが機能しますか?

2
PythonでのQQプロット
次のコードを使用してqqプロットを生成しました。qqプロットは、データが正常に分布しているかどうかを確認するために使用されることを知っています。私の質問は、x軸とy軸のラベルがqqプロットで何を示し、そのr二乗値が何を示しているかです。 N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() すでにqq plotについての議論があることは知っていますが、その議論を経験したにもかかわらず、の概念を理解できませんでした。

4
QQプロットの定量化
qq-plotは、2つの分布がどの程度類似しているかを視覚化するために使用できます(たとえば、正規分布に対する分布の類似性を視覚化するだけでなく、2つのArtibraryデータ分布を比較することもできます)。それらの類似性を表すより客観的な数値測定値を生成する統計情報はありますか(できれば正規化された(0 <= x <= 1)形式で)。ジニ係数は、たとえばローレンツ曲線を扱うときに経済学で使用されます。QQプロットに何かありますか?

2
QQプロットの参照線が45°ではありません
qqplot()正規分布の理論的な分位数に対して、MATLABで(標準化された)リターンデータをプロットしていました。ただし、QQプロットの線には45度の角度はありませんが、少し回転しています。 QQプロットの概念を誤解しているかもしれませんが、正確に45度の線であるとは思われませんか? 私は問題を説明するためにプロットを入れました。
10 matlab  qq-plot 


2
データのROC曲線を計算する
そのため、ハミング距離を使用して生体認証特性から個人を認証しようとしている16のトライアルがあります。しきい値は3.5に設定されています。私のデータは以下であり、トライアル1のみが真陽性です。 Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 私の混乱のポイントは、このデータからROC曲線(FPR対TPR OR FAR対FRR)を作成する方法が本当にわからないということです。どちらでもかまいませんが、どうやって計算するのか混乱しています。任意の助けいただければ幸いです。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
QQプロットの均一分布から観測された期待値と期待されるp値を計算する
インフレの度合い(つまり、観測されたデータポイントが予想にどの程度適合するか)を定量化しようとしています。1つの方法は、QQプロットを見ることです。しかし、インフレの数値指標を計算したいと思います。つまり、観測された値が理論上の均一分布にどれだけよく適合するかを意味します。 データの例: # random uniform distribution pvalue <- runif(100, min=0, max=1) # with inflation expected i.e. not uniform distribution pvalue1 <- rnorm(100, mean = 0.5, sd=0.1)

2
QQプロットと
qqplotは線形ですが、勾配が45度の線と同じでない場合、これは何を示唆していますか? 私はラプラス分布のサンプルデータへの適合を調べようとしているので、ランダムにラプラス分布(サンプルから推定されたパラメーターを使用)の観測を生成し、それらをサンプルに対してプロットしました。 qqplot(rand, sample) abline(0, 1, col = 'red')
7 r  qq-plot 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.