タグ付けされた質問 「statistical-significance」

統計的有意性とは、このサンプルが引き出された母集団において、真の効果が0(またはいくつかの仮説値)であった場合、サンプルで得られたものよりも極端または極端なテスト統計が発生した確率を指します。

3
NPS(ネットプロモータースコア)結果の誤差を計算するにはどうすればよいですか?
ウィキペディアにNPSの計算方法を説明します。 ネットプロモータースコアは、0〜10の評価尺度で顧客に1つの質問をすることで得られます。10は「非常に可能性が高い」、0は「まったくそうではない」です。友達ですか?」回答に基づいて、顧客は3つのグループ(プロモーター(9〜10の評価)、受動的(7〜8の評価)、および中傷者(0〜6の評価)のいずれかに分類されます。次に、中傷者の割合をプロモーターの割合から差し引いて、ネットプロモータースコア(NPS)を取得します。NPSは、-100程度の低さ(全員が批判者)、または+100程度の高さ(全員がプロモーター)です。 この調査は数年間定期的に実施されています。毎回数百の応答があります。結果のスコアは、時間の経過とともに20〜30ポイント変化しました。私は、もしあれば、どのスコアの動きが重要かを見極めようとしています。 それが単純に難しすぎると判明した場合、計算の基本の誤差を把握することに興味があります。各「バケツ」(プロモーター、パッシブ、ディトラクター)の許容誤差はどのくらいですか?スコアの平均を見るだけで、データを調査の実行ごとに1つの数値に減らした場合、誤差の範囲はどのくらいでしょうか?それは私をどこにでも連れて行くでしょうか? ここでのアイデアは役に立ちます。「NPSを使用しないでください」を除きます。その決定は、私の変化する能力の範囲外です!

5
分布の違いの重要性の評価
2つのデータグループがあります。それぞれが複数の変数の異なる分布を持つ。これら2つのグループの分布が統計的に有意な方法で異なるかどうかを判断しようとしています。データは生の形式であり、それぞれに頻度カウントがある個別のカテゴリを扱いやすいようにビニングされています。 これらの2つのグループが大幅に異なるかどうかを判断するには、どのテスト/手順/方法を使用する必要があり、SASまたはR(またはオレンジ)でそれを行うにはどうすればよいですか?

2
医療関係者の信頼できる間隔を要約する方法
スタンおよびフロントエンドパッケージを使用するrstanarmかbrms、以前のような混合モデルで行ったように、ベイジアン方式でデータを簡単に分析できますlme。Kruschke-Gelman-Wagenmakers-etcの本や記事のほとんどを私の机に置いていますが、これらは、ベイジアンの怒りのSkyllaとメディカルレビュアーのCharybdisの間で引き裂かれた、医療聴衆のために結果を要約する方法を教えてくれません( 「拡散的なものではなく、重要なものが必要です」)。 例:胃の頻度(1 /分)は3つのグループで測定されます。健康なコントロールが基準です。参加者ごとにいくつかの測定値がありますので、頻繁に使用する次の混合モデルを使用しましたlme。 summary(lme(freq_min~ group, random = ~1|study_id, data = mo)) わずかに編集された結果: Fixed effects: freq_min ~ group Value Std.Error DF t-value p-value (Intercept) 2.712 0.0804 70 33.7 0.0000 groupno_symptoms 0.353 0.1180 27 3.0 0.0058 groupwith_symptoms 0.195 0.1174 27 1.7 0.1086 簡単にするために、2 * stdエラーを95%CIとして使用します。 頻繁な文脈では、私はこれを次のように要約したでしょう。 対照群では、推定頻度は2.7 /分でした(ここにCIを追加することもできますが、絶対CIと差分CIによって生じる混乱のために、これを避けることがあります)。 no_symptomsグループでは、頻度は0.4 /分、CI(0.11〜0.59)/分、p = …

4
新しいベクターをPCA空間に投影する方法は?
主成分分析(PCA)を実行した後、新しいベクトルをPCA空間に投影します(つまり、PCA座標系で座標を見つけます)。 を使用してR言語でPCAを計算しましたprcomp。これで、ベクトルにPCA回転行列を掛けることができるはずです。このマトリックスの主成分を行または列に配置する必要がありますか?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
帰無仮説を棄却するには0.04993のp値で十分ですか?
Wilcoxonの符号付きランクの統計的有意性検定で、値を生成するデータに。しきい値が場合、この結果は帰無仮説を棄却するのに十分ですか?または、p値を小数点以下3桁に丸めるとになるため、テストが決定的ではなかったと言っても安全ですか?0.04993 p &lt; 0.05 0.050ppp0.049930.049930.04993p&lt;0.05p&lt;0.05p < 0.050.0500.0500.050

4
p値を互いに比較することはどのような意味がありますか?
私には2つの集団(男性と女性)があり、それぞれにサンプルが含まれています。サンプルごとに、AとBの2つのプロパティがあります(1年生の成績平均とSATスコア)。私はAとBに別々にt検定を使用しました:両方とも2つのグループの間に大きな違いがありました。P = 0.008とし、B 、P = 0.002。100010001000p = 0.008p=0.008p=0.008p = 0.002p=0.002p=0.002 プロパティBはプロパティAよりも差別的(より重要)であると主張しても大丈夫ですか?それとも、t検定は、はいまたはいいえ(有意または有意でない)尺度であるだけですか? 更新:ここのコメントおよびウィキペディアで読んだことによると、答えは無意味なp値を下げて効果サイズを報告する必要があると思います。何かご意見は?

4
エッジケースの精度と再現率の正しい値は何ですか?
精度は次のように定義されます: p = true positives / (true positives + false positives) それは、それを修正しているtrue positivesとfalse positives、精度が1に近づくアプローチ0? リコールに関する同じ質問: r = true positives / (true positives + false negatives) 現在、これらの値を計算する必要がある統計テストを実装していますが、分母が0である場合があり、この場合にどの値を返すのか迷っています。 PS:不適切なタグをすみません、、およびを使用したいのですがrecall、新しいタグをまだ作成できません。precisionlimit
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
誤発見率と複数のテストとの混同(Colquhoun 2014)
David Colquhounによるこの素晴らしい論文を読んでいます:偽発見率とp値の誤解の調査(2014)。本質的に、彼はでタイプIのエラーを制御しているにもかかわらず、偽発見率(FDR)が達する理由を説明しています。30%30%30\%α = 0.05α=0.05\alpha=0.05 ただし、複数のテストの場合にFDR制御を適用するとどうなるかについて、まだ混乱しています。 たとえば、多くの変数のそれぞれについてテストを実行し、Benjamini-Hochberg手順を使用して値を計算しました。重要な変数を1つ取得しました。この発見のFDRとは何ですか?qqqq= 0.049q=0.049q=0.049 長期的に、このような分析を定期的に行うと、FDRはではなくであると安全に仮定できますか?Benjamini-Hochbergを使用したためです。それは間違っていると思いますが、値はColquhounの論文の値に対応しており、彼の推論もここに適用されるため、しきい値を使用すると、 Colquhounはそれをケースのに入れています。しかし、私はそれをより正式に説明しようとして失敗しました。5 %30 %30%30\%5 %5%5\%qqqpppqqq0.050.050.0530 %30%30\%

1
統計表に記載されていない(内挿する)値を見つけるにはどうすればよいですか?
多くの場合、人々はプログラムを使用してp値を取得しますが、場合によっては-何らかの理由で、テーブルのセットから重要な値を取得する必要がある場合があります。 限られた数の有意水準と限られた数の自由度を持つ統計表が与えられた場合、他の有意水準または自由度(、カイ2乗、表など)で近似臨界値を取得する方法?tttFFF つまり、テーブル内の値の「間にある」値を見つけるにはどうすればよいですか?

2
仮説検定と時系列の重要性
2つの母集団を調べる際の通常の有意性の検定は、可能であればt検定とペアt検定です。これは、分布が正常であることを前提としています。 時系列の有意性検定を生成する同様の単純化された仮定はありますか?具体的には、2種類のかなり小さなマウスの集団が別々に処理されており、週に1回体重を測定しています。両方のグラフはスムーズに増加する関数を表示し、1つのグラフが他のグラフの上に確実に表示されます。この文脈で「明確さ」をどのように定量化するのでしょうか? 帰無仮説は、2つの母集団の重みが時間の経過とともに「同じように振る舞う」ということです。少数のパラメーターのみでかなり一般的な(正規分布が一般的であるように)単純なモデルの観点から、これをどのように定式化できますか?それを行ったら、どのように有意性またはp値に類似した何かを測定できますか?マウスをペアリングして、可能な限り多くの特性を一致させ、各ペアが2つの母集団のそれぞれから1つの代表を持っている場合はどうでしょうか? 時系列についての、よく書かれたわかりやすい本や記事へのポインターを歓迎します。私は無知から始めます。ご協力いただきありがとうございます。 デビッド・エプスタイン

3
統計的に有意になるようにデータをシミュレートする方法は?
私は10年生で、機械学習サイエンスフェアプロジェクトのデータをシミュレートしたいと考えています。最終モデルは患者データで使用され、特定の時間帯と、これが単一患者のデータ内の服薬遵守に与える影響との相関関係を予測します。順守値はバイナリになります(0は薬を服用しなかったことを意味し、1は服用したことを意味します)。私は、週の時間の関係から学習できる機械学習モデルを作成し、週を21の時間帯に分けています。1時間ごとに3つ(1は月曜日の朝、2は月曜日の午後、等。)。1,000人の患者に相当するデータをシミュレートしたいと考えています。各患者には30週間分のデータがあります。週の時間とアドヒアランスに関連する特定のトレンドを挿入したいと思います。例えば、あるデータセットでは、週の時間帯7は順守と統計的に有意な関係があると言えます。関係が統計的に有意であるかどうかを判断するには、1つのタイムスロットを他のタイムスロットと比較する2サンプルt検定を実行し、有意値が0.05未満であることを確認する必要があります。 ただし、自分のデータをシミュレートして挿入した傾向が重要かどうかを確認するのではなく、逆方向に作業して、特定のタイムスロットに重要な傾向を順守して割り当てることができるプログラムを使用すると、戻りますその中に私が求めたトレンドを含むバイナリデータ、およびノイズを含むが統計的に有意なトレンドを生成しない他のタイムスロットのバイナリデータ。 このようなことを達成するのに役立つプログラムはありますか?それとも、Pythonモジュールですか? どんな助けでも(私のプロジェクトに関する一般的なコメントでさえ)非常に感謝されます!

3
フィッシャーの正確なテストについて:女性がミルクファーストカップの数を知らなければ、どのテストが適切だっただろうか?
RA Fisherによる有名なレディテイスティングティーの実験では、ミルクファースト/ティーファーストカップの数が知らされます(8カップのうち4カップ)。これは、フィッシャーの正確検定の固定限界総仮定を尊重します。 私は友人とこのテストを行うことを想像していましたが、その考えに衝撃を受けました。女性がミルクファーストカップとティーファーストカップの違いを本当に理解できれば、ミルクファースト/ティーファーストカップの限界合計と、どのカップがどれであるかを把握できるはずです。 そこで質問は次のとおりです。RAFisherがミルクファーストカップとティーファーストカップの合計数を女性に通知していなかった場合、どのテストを使用できたでしょうか。

3
結果を「非常に重要」と呼ぶのは間違っていますか?
値が従来のレベルのはるかに下回る場合、統計学者が結果を「非常に重要」と呼ぶことを思いとどまらせるのはなぜですか?α 0.05pppαα\alpha0.050.050.05 99%()の確率しか得られない結果よりも、タイプIエラー()ではない確率が99.9%の結果を信頼することは本当に間違っていますか?p = 0.01p = 0.001p=0.001p=0.001p = 0.01p=0.01p=0.01

5
ん持って-squared -値を?
乗値にも値があるかどうかを理解しようとして混乱しているようです。prrrppp 私が理解しているように、データポイントのセットとの線形相関では、はから範囲の値を持つことができ、この値は、それが何であれ、がと著しく異なるかどうかを示す値を持つことができます(つまり、 、2つの変数の間に線形相関がある場合)。− 1 1 p r 0rrr− 1−1-1111ppprrr000 線形回帰に移ると、関数をデータに適合させることができます。これは、方程式で記述されます。と (切片と勾配)にも値があり、それらが大きく異なるかどうかを示し。a b p 0Y= a + b XY=a+bXY = a + bXaaabbbppp000 私は今のところ正しいのすべてを理解していると仮定すると、あるための-値とための-値だけで同じこと?それは値を持つ乗ではなく、またはを持つと言うのは正しいですか?r p b r p r bppprrrpppbbbrrrppprrrbbb

1
線形回帰でカテゴリ変数の統計的有意性をテストする方法は?
線形回帰でカテゴリ変数がある場合...カテゴリ変数の統計的有意性をどのようにして知ることができますか? 因子は10個のレベルがあり、1つの因子変数傘下で、10の異なる結果のt値があるとしましょう。X 1X1X1X_1X1X1X_1 因子変数の各レベルに対して統計的有意性がテストされているように思えますか?番号? @Macro:あなたの提案に従って、次の例を作成しました。 以下のモデル比較から、x3は有用であり、モデルに含める必要があるようです。 しかし、実際にはそれは間違っています... n=100 x1=1:n x2=(1:n)^2 x3=rnorm(n) ee=rnorm(n) y=3*x1-2*x2+x3+3+ee lm1=lm(y~x1+x2+x3) summary(lm1) lm2=lm(y~x1+x2) summary(lm2) anova(lm1, lm2) &gt; anova(lm1, lm2) Analysis of Variance Table Model 1: y ~ x1 + x2 + x3 Model 2: y ~ x1 + x2 Res.Df RSS Df Sum of Sq F Pr(&gt;F) …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.