タグ付けされた質問 「statistical-significance」

統計的有意性とは、このサンプルが引き出された母集団において、真の効果が0(またはいくつかの仮説値)であった場合、サンプルで得られたものよりも極端または極端なテスト統計が発生した確率を指します。

1
車が殺人兵器として使用されていることを統計的に示すことができますか?
私は最近誰かが誰かを殺したいなら(そしてそれを避けたいなら)彼らは自分の車でそれをやるだろうと言った話を聞いた。彼らは、自動車関連の死亡者数(自動車を含む歩行者を含む)に関するさまざまな統計と、実際にあらゆる種類の犯罪を宣告されたドライバーの数に関する追加の統計を組み合わせて引用しました。 私の質問はこれです。車が殺人を犯すための武器として実際に(統計的に言えば)使用されていることを実証することは統計的に実現可能ですか? 言い換えれば、歩行者専用車の「事故」が実際に殺人未遂/殺人だったことを証明することは不可能かもしれないと私は理解しています。むしろ、それらの「事故」のいくつかの割合が実際には、おそらく、まったく事故ではないことを実証できる方法が想像されるのではないかと思っています...

1
非正規分布のエラーが重要性ステートメントの有効性を損なうのはなぜですか
OLSモデルを検討する場合、正規性の仮定があり、エラーは正規分布します。私はCross Validatedを閲覧してきましたが、エラーが正常であるために、YとXが通常である必要はないようです。私の質問は、非正規分布エラーがある場合、なぜ重要性ステートメントの有効性が損なわれるのかということです。信頼区間が広すぎたり狭すぎたりするのはなぜですか?

4
平均差がほぼ0の場合、t検定はどのように統計的に有意ですか?
2つの母集団のデータを比較して、処理間の差が統計的に有意であるかどうかを確認しようとしています。データセットは、2つのセットの違いがほとんどない正規分布のように見えます。平均差は0.00017です。平均値に差がないという帰無仮説を棄却できないと予想して、対応のあるt検定を実行しましたが、計算したt値は臨界t値よりもはるかに高くなっています。

2
データが指数分布に適合する2つのサンプルの平均を比較する方法
データの2つのサンプル、ベースラインサンプル、および処理サンプルがあります。 仮説は、処理サンプルの平均がベースラインサンプルよりも高いというものです。 どちらのサンプルも指数関数的です。データはかなり大きいので、テストを実行するときの各サンプルの要素の平均と数しかありません。 どうすればその仮説を検証できますか?私はそれが非常に簡単であると思います、そして私はF-Testを使用するためのいくつかの参照に出くわしましたが、パラメーターがどのようにマップされるかわかりません。

1
観測48で革新的な異常値をARIMAモデルに組み込むにはどうすればよいですか?
私はデータセットに取り組んでいます。いくつかのモデル識別手法を使用した後、私はARIMA(0,2,1)モデルを思いつきました。 R detectIOのパッケージの関数を使用して、元のデータセットの48回目の観測で革新的な外れ値(IO)TSAを検出しました。 この外れ値をモデルに組み込んで、予測に使用するにはどうすればよいですか?Rではそれから予測を行うことができない可能性があるため、ARIMAXモデルを使用したくありません。これを行う方法は他にありますか? これが私の値です。 VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0 9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
観察された対立遺伝子頻度は予測よりも大幅に少ないですか?
質問:観察された「山」対立遺伝子頻度(図1)が生態学的選択モデル(詳細は以下を参照)によって予測された(図2)よりも中央から南部の山で著しく低いかどうかを判断するテストを構築するにはどうすればよいですか? 問題:私の最初の考えは、緯度:経度と高度に対してモデルの残差を回帰することでした(これにより、緯度と経度の間の相互作用のみが重要になります)。問題は、残差(図3)がモデルによって説明されない変動を反映していること、および/またはそれらが生物学的に起こっていることである、たとえば対立遺伝子がそのポテンシャルまで南に広がる時間がない、または遺伝子の流れに対する何らかの障壁があることです。観測された(図1)と予想された(図2)の山アレル頻度を比較すると、特にスウェーデンとノルウェーの中央から南部の山では明らかな違いがあります。モデルがすべてのバリエーションを説明しない可能性があることは認めますが、山岳対立遺伝子が中部山脈から南部山脈でその可能性に達していないという考えを調査するための合理的なテストを考え出すことはできますか? バックグラウンド:私はバイアレルAFLPマーカーを持っています。その頻度分布は、スカンジナビア半島の低地生息地と山(および緯度:経度)に関連しているようです(図1)。「山」対立遺伝子は、山岳地帯である北部でほぼ固定されています。それは山が欠けている南の「低地」対立遺伝子のためにほとんど欠けているか固定されています。山の中を北から南に移動すると、「山」対立遺伝子はより低い頻度で発生します。北から南への「山」対立遺伝子頻度のこの違いは、地域が北と南の両方から植民地化されたため、単純に系統地理学または歴史的プロセスが原因である可能性があります。たとえば、山岳対立遺伝子が北部の人口に由来する場合、おそらく南部の人口に完全に拡大する時間がありませんでした。 私の作業仮説は、「山」対立遺伝子頻度が生態学的選択の結果であるというものです(帰無仮説は中立選択です)。 私の生態学的選択モデルでは、応答変数として二項対立遺伝子頻度(通常、各サイトで10から20の個体がサンプリングされたフェノスカンジナビア全体で129のサイトでサンプリング)と、いくつかの気候および成長期変数を使用して、一般化加法モデル(GAM)を使用しました。予測変数。モデルの結果は次のとおりです(TMAX04-06 = 4月から6月の最高気温、Phen_NPPMN =平均成長期の植生生産性、PET_HE_YR =年間の潜在的な蒸発散量、Dist_Coast =海岸までの距離): Family: binomial Link function: logit Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + s(PET_HE_YR) + s(Dist_Coast) Parametric coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.74372 0.04736 -15.7 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …

3
統計的有意性を使用して2つの異なるモデルの精度を比較する方法
私は時系列予測に取り組んでいます。2つのデータセットとます。 3つの予測モデルがあります。これらのモデルはすべて、データセットサンプルを使用してトレーニングされ、そのパフォーマンスはデータセットサンプルを使用して測定されます。パフォーマンスメトリックがMSE(またはその他)であるとします。データセットについて測定し、それらのモデルのMSEある及び。あるモデルの別のモデルに対する改善が統計的に有意であることをどのようにテストできますか?D1={x1,x2,....xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\}D2={xn+1,xn+2,xn+3,....,xn+k}D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\}M1,M2,M3M1,M2,M3M1, M2, M3D1D1D1D2D2D2D2D2D2MSE1,MSE2,MSE1,MSE2,MSE_1, MSE_2, MSE3MSE3MSE_3 たとえば、、、、これらのMSEの計算に基づくデータセットサンプルの総数が2000 であるとします、、およびが大幅に異なることをどのようにテストできますか。誰かがこの問題で私を助けることができれば私は非常に感謝します。MSE1=200MSE1=200MSE_1=200MSE2=205MSE2=205MSE_2=205MSE3=210MSE3=210MSE_3=210D2D2D2MSE1MSE1MSE_1MSE2MSE2MSE_2MSE3MSE3MSE_3

1
比率とバイナリ分類器のテスト
部品を作る機械のプロトタイプを持っています。 最初のテストで、マシンはパーツを生成し、バイナリ分類子は、パーツに欠陥があり(、通常および)、パーツが良好であることをてくれます。d 1 d 1 &lt; N 1 d 1 /N1N1N_1d1d1d_1d1&lt; N1d1&lt;N1d_1 < N_1N 1 ≈ 10 4 N 1 - D 1d1/ N1&lt; 0.01d1/N1&lt;0.01d_1/N_1<0.01N1≈ 104N1≈104N_1\approx10^4N1− d1N1−d1N_1-d_1 次に、技術者は、欠陥のある部品の数を減らすために、機械に変更を加えます。 2回目以降のテストでは、変更されたマシンがパーツを生成し、同じバイナリ分類子(そのまま)により、パーツに欠陥があることがます。とにかく、はと非常に似ています。d 2 d 2 / N 2 dN2N2N_2d2d2d_2d2/N2d2/N2d_2/N_2d1/N1d1/N1d_1/N_1 技術者は、彼の変更が有効かどうかを知りたいと考えています。 分類子が完全である(その感度が100%で、その特異度が100%である)と仮定すると、比率のテストを実行できます(Rを使用して、と入力するだけですprop.test(c(d1,d2),c(N1,N2)))。 しかし、分類子は完全ではないので、技術者に適切に回答するために、分類子の感度と特異度(どちらも不明)をどのように考慮することができますか?

3
相関行列の相関の統計的有意性を示す相関係数のしきい値
各データポイントが14の特性を含む455のデータポイントを含むデータセットの相関行列を計算しました。したがって、相関行列の次元は14 x 14です。 これらの2つの特性の間に有意な相関があることを示す相関係数の値にしきい値があるかどうか疑問に思っていました。 私は-0.2から0.85の範囲の値を持っています、そして私は重要なものは0.7を超えるものであると考えていました。 しきい値と見なす必要がある相関係数の一般的な値はありますか、それとも、調査しているデータタイプに依存しているだけですか?


1
有意差検定は、無作為化グループをベースラインで比較する意味がありますか?
多くのランダム化比較試験(RCT)論文は、グループが実際に類似していることを示すために、ランダム化の直後/前にベースラインパラメーターの有意性検定を報告しています。これは多くの場合、「ベースライン特性」テーブルの一部です。ただし、有意差検定では、観測された(またはより強い)差異が偶然に得られる確率を測定します。そして、検定が有意である場合、その程度のランダムな差はありそうもないため、真の差があると結論付けます。有意差検定は、差が偶然によるものでなければならないことがわかっている場合、無作為化後に意味がありますか?

4
グラフで谷を探す方法は?
私は、基本的に整数の長いリスト(数百万の値)であるゲノムカバレッジデータをいくつか調べています。各整数は、ゲノム内のこの位置がカバーされている(または「深い」)ことを示しています。 このデータで「谷」、つまり周囲の環境よりも大幅に「低い」領域を探したいのですが。 私が探している谷のサイズは、50塩基から数千の範囲であることに注意してください。 それらの谷を見つけるためにどのようなパラダイムを使用することをお勧めしますか? 更新 データのいくつかのグラフィカルな例: アップデート2 谷とは何かを定義することは、もちろん私が苦労している問題の1つです。これらは私にとって明白なものです: しかし、さらに複雑な状況がいくつかあります。一般に、私が検討する3つの基準があります。1.グローバル平均に対するウィンドウ内の(平均?最大?)カバレッジ。2.直接の周囲に関するウィンドウの(...)カバレッジ。3.ウィンドウどのように大規模である:私は短いスパンのために非常に低いカバレッジを見れば、それは私が短いスパンのために軽度の低カバレッジを見れば、それはだ、私は長いスパンのために非常に低いカバレッジを見れば、それはまた面白い、面白いですない本当に面白いです、ただし、長いスパンでカバレッジが少し低い場合-それはそうです。つまり、それは、sapnの長さとカバレッジの組み合わせです。それが長いほど、カバレッジを高くし、それでも谷と見なします。 おかげで、 デイブ

3
制約付き(負でない)最小二乗法でのp値の計算
私はMatlabを使用して制約なしの最小二乗(通常の最小二乗)を実行しており、係数、検定統計量、およびp値を自動的に出力します。 私の質問は、制約付き最小二乗(厳密に非負の係数)を実行すると、テスト統計なしでp値のみを出力することです。 これらの値を計算して有意性を保証することは可能ですか?そして、なぜそれはソフトウェア(またはそのことに関して他のソフトウェア)で直接利用できないのですか?

2
Rの2つの多項式回帰の差の統計的有意性を比較する
まず、このフォーラムでいくつかの調査を行いましたが、非常によく似た 質問が行われたことはわかっていますが、通常は適切に回答されていないか、回答の詳細がわからないだけで理解できない場合があります。したがって、今回は私の質問は次のとおりです。2つのデータセットがあり、それぞれに次のような多項式回帰を行います。 Ratio&lt;-(mydata2[,c(2)]) Time_in_days&lt;-(mydata2[,c(1)]) fit3IRC &lt;- lm( Ratio~(poly(Time_in_days,2)) ) 多項式回帰プロットは次のとおりです。 係数は次のとおりです。 &gt; as.vector(coef(fit3CN)) [1] -0.9751726 -4.0876782 0.6860041 &gt; as.vector(coef(fit3IRC)) [1] -1.1446297 -5.4449486 0.5883757 そして、私が知りたいのは、R関数を使用して、関連する日数の間隔が[ 1,100]。 私が理解したことから、値は2つの異なるデータセットからも、モデル/真のデータの比較に使用されるAICからも得られるため、anovaテストを直接適用することはできません。 私は関連する質問で@Rolandによって与えられた指示に従ってみましたが、私の結果を見て、おそらく何かを誤解しました: これが私がしたことです: 両方のデータセットを1つに結合しました。 f@Rolandが話している変動要因です。最初のセットには1を入れ、他のセットには0を入れました。 y&lt;-(mydata2[,c(2)]) x&lt;-(mydata2[,c(1)]) f&lt;-(mydata2[,c(3)]) plot(x,y, xlim=c(1,nrow(mydata2)),type='p') fit3ANOVA &lt;- lm( y~(poly(x,2)) ) fit3ANOVACN &lt;- lm( y~f*(poly(x,2)) ) 私のデータは今このように見えます: 赤いものはfit3ANOVAまだ機能していますがfit3ANOVACN、モデルの奇妙な結果を持つ青いものに問題があります。フィットモデルが正しいかどうかはわかりません。@ Rolandが正確に何を意味するのかわかりません。 @DeltaIVソリューションを考えると、私はその場合を想定し ています。私はそう仮定する権利がありますか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.