タグ付けされた質問 「hypothesis-testing」

仮説検定では、データがランダムな変動の影響ではなく、特定の仮説と矛盾しているかどうかを評価します。

5
「p-value」の正しいスペル(大文字、斜体、ハイフネーション)
これはつまらなくてささいなことだと思いますが、統計学以外の分野の研究者として、統計学の正式な教育が限られているため、「p-value」を正しく書いているのかといつも思っています。具体的には: 「p」は大文字にする必要がありますか? 「p」は斜体にする必要がありますか?(または数学フォントで、TeXで?) 「p」と「value」の間にハイフンがあるはずですか? あるいは、「p-value」を記述する「適切な」方法はまったくありません。これらのオプションの並べ替えで「value」の隣に「p」を置くだけで、どういう意味か理解できますか?

7
2つの連続変数が独立していることをテストするにはどうすればよいですか?
XとYの共同分布からのサンプルがあるとします。XとYは独立しているという仮説をどのように検証しますか?(Xn,Yn),n=1..N(Xn,Yn),n=1..N(X_n,Y_n), n=1..NXXXYYYXXXYYY XXXとYの結合または周辺分布の法則については仮定されていませんYYY(すべての結合の正規性の中で、独立性は相関が0であるため同一です000) XXXとYの間の可能な関係の性質については想定されていませんYYY。非線形である可能性があるため、変数は無相関(r=0r=0r=0)ですが、高度に共依存(I=HI=HI=H)です。 私は2つのアプローチを見ることができます: 両方の変数をビンし、フィッシャーの正確検定またはG 検定を使用します。 プロ:定評のある統計検定を使用する 短所:ビニングに依存 推定依存性のと:(これはの独立のためにととそれらは互いに完全に決定)。XXXYYYI(X;Y)H(X,Y)I(X;Y)H(X,Y)\frac{I(X;Y)}{H(X,Y)}000XXXYYY111 プロ:明確な理論的意味を持つ数字を生成します Con:おおよそのエントロピー計算に依存します(つまり、再びビニングします) これらのアプローチは理にかなっていますか? 人々が使用する他の方法は何ですか?

7
カイ2乗は常に片側検定ですか?
公開された記事(pdf)には、次の2つの文が含まれています。 さらに、誤った報告は、誤ったルールの適用または統計的テストの知識不足によって引き起こされる可能性があります。たとえば、ANOVAの合計dfは、検定のレポートのエラーdfであると見なされるか、研究者がまたは検定の報告されたp値をで除算するワンサイド値は、一方の値やテスト既に片側検定です。χ 2 Fのp個のP χ 2 FFFFχ2χ2\chi^2FFFppppppχ2χ2\chi^2FFF なぜ彼らはそれを言ったのでしょうか?カイ二乗検定は、両側検定です。(著者の一人に尋ねましたが、返事はありませんでした。) 私は何かを見落としていますか?

5
サンプルが母集団である場合の統計的推論
毎年、特定のテストを受ける候補者の数について報告する必要があると想像してください。たとえば、対象集団の特異性により、より広い集団で観測された成功率を推測するのはかなり難しいようです。したがって、これらのデータは母集団全体を表していると考えることができます。 テストの結果は、男性と女性の比率が異なることを本当に示していますか?標本全体ではなく母集団全体を考慮するため、観察された割合と理論上の割合を比較するテストは正しいものと思われますか?

2
なぜ頻繁な仮説検定は、十分に大きいサンプルで帰無仮説を棄却するように偏るのですか?
このパッセージにつまずいたとき、私はまったく無関係な問題についてベイズ因子に関するこの記事を読んでいた ベイズ形式はモデル選択のバイアスを回避し、帰無仮説を支持して証拠を評価し、モデルの不確実性を含み、ネストされていないモデルを比較できるため、ベイズ因子を使用した仮説検定は、頻繁な仮説検定よりも堅牢です同じ従属変数を持つ)。また、十分な大きさのサンプルサイズで帰無仮説を棄却するために、頻繁な有意性検定は偏りが生じます。[強調を追加] 私はで前にこの主張を見てきた脳画像でカールFristonの2012紙、彼はそれを呼び出す、古典推論の誤謬。 なぜこれが真実なのかという真に教育的な説明を見つけるのに少し苦労しました。具体的には、私は疑問に思っています: これが起こる理由 それを防ぐ方法 それに失敗した、それを検出する方法


3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

1
タイプI、タイプII、およびタイプIII ANOVAおよびMANOVAの解釈方法
私の主な質問は、タイプI(シーケンシャル)分散分析を実行するときに出力(係数、F、P)を解釈する方法です。 私の特定の研究問題はもう少し複雑なので、私の例をいくつかに分けます。まず、植物の成長(Y1)に対するクモの密度(X1)の影響に興味があり、囲いに苗木を植え、クモの密度を操作した場合、単純なANOVAまたは線形回帰でデータを分析できます。その後、ANOVAにタイプI、II、またはIIIの二乗和(SS)を使用したかどうかは関係ありません。私の場合、5つの密度レベルの複製が4つあるため、密度を因子または連続変数として使用できます。この場合、私はそれを連続的な独立(予測)変数として解釈することを好みます。RIでは、次を実行できます。 lm1 <- lm(y1 ~ density, data = Ena) summary(lm1) anova(lm1) anova関数を実行すると、後で比較できることを願っていますので、ここで奇妙な点を無視してください。出力は次のとおりです。 Response: y1 Df Sum Sq Mean Sq F value Pr(>F) density 1 0.48357 0.48357 3.4279 0.08058 . Residuals 18 2.53920 0.14107 さて、私がコントロールできなかった土壌中の無機窒素の開始レベルも、植物の成長に大きな影響を与えたのではないかと疑っているとしましょう。私はこの効果に特に興味はありませんが、それが引き起こす変動を潜在的に説明したいと思います。実際、私の主な関心はクモの密度の効果です(仮説:クモの密度の増加は植物の成長の増加を引き起こします-おそらく草食性昆虫の減少によるものですが、メカニズムではなく効果のみをテストしています)。無機Nの効果を分析に追加できます。 私の質問のために、相互作用密度* inorganicNをテストし、それが有意ではないふりをして、分析からそれを削除し、次の主な効果を実行します: > lm2 <- lm(y1 ~ density + inorganicN, data = Ena) > anova(lm2) …

6
分布間のコルモゴロフ距離の動機
2つの確率分布がどれほど似ているかを測定する方法はたくさんあります。(異なるサークルで)人気のある方法は次のとおりです。 コルモゴロフ距離:分布関数間の距離。 Kantorovich-Rubinstein距離:リプシッツ定数を持つ関数の2つの分布に対する期待値の最大差111。これは分布関数間のL1L1L^1距離でもあります。 境界付きリプシッツ距離:KR距離に似ていますが、関数は絶対値がである必要があります111。 これらには異なる利点と欠点があります。3.の意味での収束のみが実際に分布の収束に正確に対応します。1.または2.の意味での収束は、一般にわずかに強くなります。(特に、X n = 1の場合Xn=1nXn=1nX_n=\frac{1}{n}は確率111で、は分布で0にXnXnX_n収束し000が、コルモゴロフ距離では収束しません。ただし、制限の分布が連続している場合、この病理は発生しません。) 初等確率または測度理論の観点から見ると、1はあるセットに含まれる確率を比較するため、非常に自然です。一方、より洗練された確率論的視点は、確率よりも期待に集中する傾向があります。また、機能分析の観点から、いくつかの機能空間との双対性に基づいた2または3のような距離は非常に魅力的です。 しかし、私の印象(間違っていれば私を修正してください!)は、統計では、コルモゴロフ距離が分布の類似性を測定するための通常好ましい方法であるということです。理由の1つは推測できます:分布の1つが有限のサポートで離散的である場合、特に実際のデータの分布である場合、モデル分布までのコルモゴロフ距離は計算が簡単です。(KR距離は計算がやや​​難しく、BL距離は実際的にはおそらく不可能です。) 私の質問(最終的に)は、統計的な目的でコルモゴロフ距離(またはその他の距離)を優先する他の理由(実用的または理論的)がありますか?

4
なぜ統計学者は、帰無仮説を受け入れるのではなく、有意でない結果は「あなたはヌルを拒否できない」ことを意味すると言うのでしょうか?
2サンプルt検定のような従来の統計的検定は、2つの独立したサンプルの関数に差がないという仮説を排除しようとすることに焦点を当てています。次に、信頼レベルを選択し、平均の差が95%レベルを超えている場合、帰無仮説を棄却できると言います。そうでない場合、「帰無仮説を拒否することはできません」。これは、私たちもそれを受け入れることができないことを暗示しているようです。帰無仮説が正しいかどうかわからないということですか? 次に、2つのサンプルの関数が同じであるという仮説を立てるテストを設計します(これは、2つのサンプルが異なるという仮説である従来の統計検定の反対です)。したがって、私の帰無仮説は、2つのサンプルが異なるというものになります。このようなテストをどのように設計する必要がありますか?p値が5%未満の場合、有意差がないという仮説を受け入れることができると言うのと同じくらい簡単でしょうか?

3
p値を組み合わせるとき、なぜ平均化しないのですか?
最近、p値を結合するFisherの方法について学びました。これは、nullの下のp値が一様分布に従うこと、および これは天才だと思います。しかし、私の質問は、なぜこの複雑な方法で行くのですか?そして、なぜp値の平均を使用し、中央限界定理を使用しないのですか?または中央値?この壮大な計画の背後にあるRAフィッシャーの天才を理解しようとしています。−2∑i=1nlogXi∼χ2(2n), given X∼Unif(0,1)−2∑i=1nlog⁡Xi∼χ2(2n), given X∼Unif(0,1)-2\sum_{i=1}^n{\log X_i} \sim \chi^2(2n), \text{ given } X \sim \text{Unif}(0,1)

5
多重比較が問題になるのはなぜですか?
多重比較の問題が実際に何であるかを理解するのは難しいと思います。簡単な例えで言えば、多くの決定を下す人は多くの間違いを犯すと言われています。そのため、ボンフェローニ補正のような非常に保守的な予防策が適用され、この人が間違いを犯す可能性ができるだけ低くなるようにします。 しかし、間違った決定の割合ではなく、その人が行ったすべての決定の中で間違いを犯したかどうかを気にするのはなぜですか? 何が私を他の類推と混同するかを説明しよう。2人の裁判官がいて、1人は60歳、もう1人は20歳だとします。それからボンフェローニの訂正は、20歳の人に執行を決定する際に可能な限り保守的であるように伝えます。しかし、60歳の人はすぐに引退する可能性があり、意思決定が少なくなるため、他の人に比べて不注意になる可能性があります。しかし、実際には、両方の裁判官は、彼らが行う決定の総数に関係なく、同様に慎重または保守的でなければなりません。この類推は多かれ少なかれ、Bonferroni補正が適用される実際の問題に変換されると思います。

3
2つの異なる回帰からの係数の等価性のテスト
これは基本的な問題のようですが、2つの異なる回帰からの係数の等価性をテストする方法が実際にはわからないことに気付きました。誰もこれにいくらか光を当てることができますか? より正式に、私は、次の2つの回帰を実行したとします と どこ、回帰の計画行列を指し、、および回帰における係数のベクトルに。とは潜在的に非常に異なっており、異なる次元などがあることに注意してください。たとえば、かどうかに興味があります。、Y 2 = X 2 β 2 + ε 2 X I I β I I X 1 X 2 β 11 ≠ β 21y1= X1β1+ ϵ1y1=X1β1+ϵ1 y_1 = X_1\beta_1 + \epsilon_1 y2= X2β2+ ϵ2y2=X2β2+ϵ2 y_2 = X_2\beta_2 + \epsilon_2 バツ私XiX_i私iiβ私βi\beta_i私iiバツ1X1X_1バツ2X2X_2β^11≠ β^21β^11≠β^21\hat\beta_{11} \neq \hat\beta_{21} これらが同じリグレッションに由来する場合、これは簡単なことです。しかし、それらは異なるものから来ているので、私はそれを行う方法がよくわかりません。誰かがアイデアを持っていますか、私にいくつかの指針を与えることができますか? 私の問題の詳細:私の最初の直観は、信頼区間を見ることでした。そして、それらが重なる場合、それらは本質的に同じであると言えます。ただし、この手順には正しいサイズのテストが付属していません(つまり、個々の信頼区間にはありますが、それらを一緒に見ると同じ確率にはなりません)。私の「2番目」の直観は、通常のt検定を行うことでした。つまり、取るα = …

8
与えられたサンプルがポアソン分布から取得された場合、どのようにテストできますか?
正規性テストは知っていますが、「ポアソン性」をテストするにはどうすればよいですか? 〜1000個の非負整数のサンプルがありますが、これらはポアソン分布から取得されたものと思われ、それをテストしたいと思います。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.