タグ付けされた質問 「statistical-significance」

統計的有意性とは、このサンプルが引き出された母集団において、真の効果が0(またはいくつかの仮説値)であった場合、サンプルで得られたものよりも極端または極端なテスト統計が発生した確率を指します。

2
変数を分類すると、重要ではないものから重要なものに変わります
多変量ロジスティック回帰モデルでは重要ではないことが判明した数値変数があります。ただし、グループに分類すると、突然重要になります。これは私には非常に直観に反しています。変数を分類するとき、いくつかの情報を放棄します。 どうすればいいの?


2
統計テストはゼロのp値を返すことができますか?
ゼロに近い値(統計ソフトウェアによってゼロに丸められる)を意味するのではなく、文字通りゼロの値を意味します。もしそうなら、帰無仮説が真であると仮定して得られたデータを取得する確率もゼロであることを意味しますか?この種の結果を返すことができる統計テストの例(いくつかの例)は何ですか? 2番目の文を編集して、「帰無仮説の確率」というフレーズを削除しました。

3
統計的有意性に関する2つの分類器の精度結果をt検定と比較する
統計的有意性について2つの分類器の精度を比較したいと思います。両方の分類器は同じデータセットで実行されます。これは、私が読んでいたものから1つのサンプルt検定を使用するべきだと思うように導きます。 例えば: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 これは使用するのに適切なテストですか?もしそうなら、分類器間の精度の差が有意であるかどうかをどのように計算しますか? または、別のテストを使用する必要がありますか?

2
「仮説のテスト」と「有意性のテスト」の違いは何ですか?
「仮説のテスト」と「有意性のテスト」というフレーズに違いはありますか、それとも同じですか? @Micheal Lewからの詳細な回答の後、最近の仮説(たとえば、平均を検定するt検定)が「有意性検定」または「仮説検定」の例であるという混乱があります。それとも両方の組み合わせですか?簡単な例でそれらをどのように区別しますか?

2
p値の分布の大きな分散(Taleb 2016の議論)
Taleb、2016、The Meta-Distribution of Standard P-Valuesでなされた全体像の主張を理解しようとしています。 その中で、Talebは(私が理解しているように)p値の信頼性について以下の議論をしています: ある分布Xからのデータポイントを操作する推定手順は、p値を出力します。この分布からさらにn個のポイントを引き出して別のp値を出力する場合、これらのp値を平均して、いわゆる「真のp値」を限界値で取得できます。nnnXXX この「真のp値」は非常に高い分散を持っていることが示されているため、「真のp値」分布+プロシージャは、60%の時間で<.05のp値を報告します。.12.12.12 質問:値を支持して、これを従来の議論とどのように調和させることができますか。私が理解しているように、p値はあなたの手順があなたに正しい間隔(または何でも)を与える時間の割合を教えてくれるはずです。ただし、このペーパーでは、手順を再度実行するとp値が同じにならないため、この解釈は誤解を招くと主張しているようです。ppp ポイントが足りませんか?

1
Egon Pearson以外の誰かがGossetの1904年の論文にアクセスしましたか?
エゴン・ピアソン以外の誰もがウィリアム・シーリー・ゴセットの1904年の報告書「醸造所の仕事への「誤りの法則」の適用」にアクセスしましたか?私はそれがギネスの財産だと思いますが、歴史的な重要性を考えると、誰かがそれを手に入れる方法を知っていたら、それは非常に興味深い読み物だったでしょう。

3
時系列に最適な統計検定は何ですか?
一定の間隔でデータセットごとに5〜10個のデータポイントを持つ単純な時系列があります。2つのデータセットが異なるかどうかを判断する最善の方法は何だろうと思っています。各データポイントでt検定を試す必要がありますか、それとも曲線の下の領域を見る必要がありますか、それともより効果的な多変量モデルがありますか?

5
重要でない結果を「トレンド」として解釈する
最近、2人の異なる同僚が、私には不適切と思われる条件の違いについての一種の議論を使用しました。これらの同僚は両方とも統計を使用しますが、統計学者ではありません。私は統計の初心者です。 どちらの場合も、実験では2つの条件の間に大きな違いはなかったため、操作に関してこれらのグループについて一般的な主張をするのは誤りであると主張しました。「一般的な主張をする」とは、「グループAはグループBよりもXを使用する頻度が高い」と書くようなものです。 私の同僚は、「大きな違いはないが、トレンドはまだある」と「大きな違いはないが、まだ違いがある」と反論しました。私にとって、これらはどちらも偏見のように聞こえます。つまり、「差異」の意味を「偶然以外の結果の可能性が高い差異」(統計的有意性)から「任意の非差異」に変更しました。 -グループ間の測定値の差はゼロ」。 同僚の反応は正しかったですか?彼らが私を追い越したので、私は彼らとそれを取り上げませんでした。

1
基礎科学における逐次仮説検定
私は薬理学者であり、私の経験では、基本的な生物医学研究のほとんどすべての論文で、スチューデントのt検定を使用しています(推論をサポートするため、または期待に準拠するために...)。数年前、スチューデントのt検定は使用できる最も効率的なテストではないことに気付きました:順次テストでは、あらゆるサンプルサイズでより大きな検出力、または同等の検出力で平均してはるかに小さなサンプルサイズが得られます。 さまざまな複雑さの連続手順が臨床研究で使用されていますが、基本的な生物医学研究の出版物で使用されている手順を見たことはありません。私は、彼らが最も基本的な科学者が見そうなすべての入門レベルの統計教科書にも欠席していることに注意します。 私の質問は3つあります。 順次テストの非常に大きな効率の利点を考えると、なぜより広く使用されないのですか? 非統計学者によるそれらの使用が推奨されないことを意味する逐次的方法の使用に関連する欠点はありますか? 統計の学生は、シーケンシャルなテスト手順について教えられていますか?

1
帰無仮説の下で交換可能なサンプルの背後にある直感は何ですか?
順列テスト(ランダム化テスト、再ランダム化テスト、または正確なテストとも呼ばれます)は非常に便利で、たとえば、必要な正規分布の仮定がt-test満たされていない場合や、ランク付けによる値の変換時に役立ちますノンパラメトリックテストのようにMann-Whitney-U-test、より多くの情報が失われます。ただし、この種の検定を使用する場合、帰無仮説の下でのサンプルの交換可能性の仮定は1つだけの仮定を見落とすべきではありません。coinRパッケージで実装されているようなサンプルが3つ以上ある場合にも、この種のアプローチを適用できることも注目に値します。 この仮定を説明するために、平易な英語で比fig的な言葉や概念的な直観を使ってください。これは、私のような非統計学者の間で見過ごされているこの問題を明確にするのに非常に役立つでしょう。 注: 置換テストの適用が同じ仮定の下で保持または無効にならない場合に言及することは非常に役立ちます。 更新: 私の地区の地元の診療所から無作為に50人の被験者を収集したとします。彼らは、1:1の比率で薬またはプラセボを無作為に割り当てられました。それらはすべてPar1、V1(ベースライン)、V2(3か月後)、およびV3(1年後)のパラメーター1について測定されました。50個の被験者はすべて、機能Aに基づいて2つのグループにサブグループ化できます。Aポジティブ= 20およびAネガティブ=30。これらは、機能Bに基づいて別の2つのグループにサブグループ化することもできます。Bポジティブ= 15およびBネガティブ=35 。今、私はPar1すべての訪問ですべての被験者からの値を持っています。交換可能性の仮定の下で、次のPar1場合に順列検定を使用するレベルを比較でき ますか?-薬物と被験者をV2でプラセボを投与した被験者と比較する ますか?-機能Aの対象とV2の機能Bの対象を比較しますか? -V2で機能Aを持つ対象とV3で機能Aを持つ対象を比較しますか? -この比較はどのような状況で無効であり、交換可能性の仮定に違反しますか?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
二次項または相互作用項のいずれかが単独では重要ですが、どちらも一緒ではありません
割り当ての一環として、2つの予測変数を使用してモデルを適合させる必要がありました。次に、含まれている予測子の1つに対してモデルの残差のプロットを描画し、それに基づいて変更を行う必要がありました。プロットは曲線の傾向を示したため、その予測子の2次項を含めました。新しいモデルは、二次項が重要であることを示しました。これまでのところすべて良い。 しかし、データは相互作用も理にかなっていることを示唆しています。元のモデルに相互作用項を追加すると、曲線トレンドが「固定」され、モデルに追加されたときにも重要になりました(2次項なし)。問題は、二次項と相互作用項の両方がモデルに追加されるとき、それらの一方は重要ではないということです。 モデルに含める用語(2次または相互作用)とその理由

1
機能データ分析をいつ/どこで使用しますか?
私は非常に機能的なデータ解析(FDA)に新しいです。私は読んでいます: Ramsay、James O.、およびSilverman、Bernard W.(2006)、Functional Data Analysis、第2版、Springer、ニューヨーク。 ただし、FDAをどこでいつ使用するかはまだ明確ではありませんか?誰かが私に特に医学研究で例を挙げてくれませんか?私は実際にFDAをどこで/いつ適用するかを本当に知りません。 成長曲線データについては、非線形混合モデルを使用でき、縦断データについては反復測定ANOVAを使用でき、多変量データ/高次元データについてはPCA、FAなどを使用できます。 / FDAを使用する状況

4
時系列の統計的に有意な差のテスト?
同じ期間に2つの証券AとBの価格の時系列があり、同じ頻度でサンプリングされています。2つの価格の間に統計的に有意な差があるかどうかをテストしたいと思います(私の帰無仮説は差がヌルであるということです)。具体的には、価格効率を市場効率のプロキシとして使用しています。AとBが証券であり、それらと同等の合成物であると想像してください(つまり、両方ともまったく同じキャッシュフローに対する主張です)。市場が効率的である場合、両方ともまったく同じ価格(異なる取引コストなどを除く)にするか、価格差をゼロにする必要があります。これは私がテストしたいものです。そうするための最良の方法は何ですか? 私は直感的にABの時系列上、すなわち、「違い」を時系列に両側t検定を実行し、テストのためかもしれません = 0。しかし、ホモロスケスティクスエラーの可能性や外れ値の存在などを考慮した、より堅牢なテストがあるかもしれないという疑いがあります。一般的に、証券の価格を扱う際に注意すべきことはありますか?μ0μ0\mu_0

5
線形モデルの因子の有意でないレベルの係数を無視できますか?
ここで線形モデル係数についての明確化を求めた後、因子レベルの係数の重要でない(高いp値)に関するフォローアップの質問があります。 例:線形モデルに10レベルの因子が含まれ、それらのレベルのうち3つだけに有意なp値が関連付けられている場合、モデルを使用してYを予測するときに、被験者が次のいずれかに該当する場合、係数項を含めないことを選択できます非重要レベル? さらに劇的に、7つの重要でないレベルを1つのレベルにまとめて再分析するのは間違っているでしょうか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.