統計とビッグデータ hypothesis-testing

3

ANOVAを実行すると、データに適用できるように、テストの特定の仮定が存在する必要があることが通知されます。テストが機能するために次の仮定が必要だった理由について、私は理解できませんでした。従属変数（残差）の分散は、設計の各セルで等しくなければなりません従属変数（残差）は、設計の各セルにほぼ正規分布する必要があります。これらの仮定を満たす必要があるかどうかについて少し灰色の領域があることを理解していますが、議論のために、これらの仮定が特定のデータセットで完全に満たされていない場合、ANOVAを使用する際の問題は何でしょうか？

15 hypothesis-testing anova assumptions

2

不等分散のt検定における非整数の自由度の説明

SPSS t-Testプロシージャは、2つの独立した平均を比較するときに2つの分析を報告します。1つの分析は等分散を仮定し、もう1つは等分散を仮定しません。等しい分散が仮定される場合の自由度（df）は、常に整数値（およびn-2に等しい）です。等分散が仮定されていない場合のdfは非整数（11.467など）であり、n-2の近くにはありません。これらの非整数dfの計算に使用されるロジックと方法の説明を求めています。

15 hypothesis-testing t-test heteroscedasticity degrees-of-freedom t-distribution

4

固定効果モデルで時間不変変数を保持する方法

私はイタリアの大企業の従業員に関する10年以上のデータを持っていますが、男性と女性の収入の性差がどのように変化しているかを知りたいと思います。この目的のために、プールされたOLSを実行します：ここで、は1年あたりのログ収益、は個人と時間によって異なる共変量を含み、は年のダミー、は労働者が男性の場合は1、それ以外の場合はゼロです。yit=X′itβ+δmalei+∑t=110γtdt+εityit=Xit′β+δmalei+∑t=110γtdt+εit y_{it} = X'_{it}\beta + \delta {\rm male}_i + \sum^{10}_{t=1}\gamma_t d_t + \varepsilon_{it} yyyXitXitX_{it}dtdtd_tmaleimalei{\rm male}_i 今、私は共変量のいくつかが観測されていない固定効果と相関しているかもしれないという懸念を持っています。しかし、固定効果（内）推定器または最初の違いを使用すると、この変数は時間とともに変化しないため、性別ダミーが失われます。ランダム効果推定器を使用したくないのは、非常に非現実的でありそうもない仮定を置くと人々が言うのをよく耳にするからです。性別をダミーに保ち、固定効果を同時に制御する方法はありますか？方法がある場合、性別変数の仮説検定のエラーに関連する他の問題をクラスター化するか、注意する必要がありますか？

15 hypothesis-testing estimation econometrics fixed-effects-model

5

ロジスティック回帰はノンパラメトリック検定ですか？

最近、メールで次の質問を受け取りました。以下に回答を掲載しますが、他の人の考えを聞くことに興味がありました。ロジスティック回帰をノンパラメトリック検定と呼びますか？私の理解では、データが正規分布していないため、単にテストにノンパラメトリックのラベルを付けるだけでは不十分です。前提条件の欠如と関係があります。ロジスティック回帰には仮定があります。

15 hypothesis-testing logistic nonparametric

2

仮説検定の多重線形回帰

複数の線形回帰を使用してさまざまな変数のモデルを作成することに精通しています。ただし、回帰テストを使用して、基本的な仮説のテストを行う場合は興味がありました。もしそうなら、それらのシナリオ/仮説はどのように見えるでしょうか？

15 regression hypothesis-testing multiple-regression

4

仮説検定で帰無仮説を指定する方法

帰無仮説の質問を選択する方法の良い経験則は何ですか。たとえば、仮説Bが真であるかどうかを確認したい場合、Bをヌルとして、Bを対立仮説として、またはNOT Bをヌルとして使用する必要がありますか？質問が明確であることを願っています。私はそれが最小化したいエラー（タイプI？）と関係があることを知っていますが、明確な直感が構築されていないため、それがどうなるかを忘れ続けています。ありがとう。

15 hypothesis-testing

4

帰無仮説の受け入れ

これは、統計学と他の科学の共通部分に関する議論の質問です。私はしばしば同じ問題に直面します。私の分野の研究者は、p値が有意水準以上である場合、効果がないと言う傾向があります。最初は、これは仮説のテストがどのように機能するかではないとしばしば答えました。この問題が発生する頻度を考えると、この問題について経験豊富な統計学者と議論したいと思います。「最高の出版グループ」Nature Communications Biologyの科学ジャーナルの最近の論文を考えてみましょう（複数の例がありますが、1つに焦点を当てましょう）研究者は、統計的に有意ではない結果を次のように解釈します。したがって、慢性的な中程度のカロリー制限は、霊長類の寿命を延ばし、健康を向上させることができますが、認知能力に影響を与えることなく脳灰白質の完全性に影響を与えます。証明：しかし、Barnes迷路課題のパフォーマンスは、対照動物とカロリー制限動物の間で差はありませんでした（LME：F = 0.05、p = 0.82、図2a）。同様に、自発的な交替課題では、対照動物とカロリー制限動物の違いは明らかになりませんでした（LME：F = 1.63、p = 0.22、図2b）。著者はまた、効果がないことの説明を提案しているが、重要な点は説明ではなく、主張そのものである。提供されたプロットは、私にとって「目で見て」大きく異なって見えます（図2）。さらに、著者は事前知識を無視します。認知能力に対するカロリー制限の有害な影響が、ラットおよびヒトの脳および感情機能について報告されています巨大なサンプルサイズについては同じ主張を理解できますが（効果なし=実質的に有意な効果はありません）、特定の状況では複雑なテストが使用され、パワー計算の実行方法は明らかではありません。質問：それらの結論を有効にする詳細を見落としましたか？科学における否定的な結果を報告する必要性を考慮し、それが「結果の欠如」ではないことを証明する方法（）ではなく、「否定的な結果（例えば、グループ間に違いがない）」で統計？サンプルサイズが大きい場合、nullからのわずかな偏差でも拒否されることがわかりますが、理想的なデータがあり、nullが実際に正しいことを証明する必要があると仮定しましょう。p>αp>αp > \alpha 統計学者は常に、「この力を持っているため、大きな規模の影響を検出できなかった」などの数学的に正しい結論を主張すべきでしょうか？他の分野の研究者は、このような否定的な結果の定式化を強く嫌います。この問題についてのご意見をお聞かせいただければ幸いです。このWebサイトで関連する質問を読んで理解しました。質問2）-3）には統計の観点から明確な答えがありますが、学際的な対話の場合にこの質問にどのように答えなければならないかを理解したいと思います。 UPD：否定的な結果の良い例は、医療試験の第一段階である安全性だと思います。科学者が薬が安全であると判断できるとき彼らは2つのグループを比較し、このデータの統計を行っていると思います。この薬が安全であると言う方法はありますか？コクランは正確な「副作用は見つかりませんでした」と言っていますが、医師はこの薬は安全だと言います。記述の正確さと単純さのバランスが満たされ、「健康には何の影響もない」と言えますか？

15 hypothesis-testing

1

lmerモデルに使用する多重比較方法：lsmeansまたはglht？

1つの固定効果（条件）と2つのランダム効果（被験者内のデザインとペアによる参加者）を含む混合効果モデルを使用して、データセットを分析しています。モデルはlme4パッケージで生成されました：exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)。次に、固定効果（条件）のないモデルに対してこのモデルの尤度比検定を実行しましたが、有意差があります。データセットには3つの条件があるため、多重比較を行いたいのですが、どの方法を使用すればよいかわかりません。CrossValidatedや他のフォーラムで同様の質問をいくつか見つけましたが、それでもかなり混乱しています。私が見たものから、人々は使用することを提案しました 1.lsmeansパッケージ- lsmeans(exp.model,pairwise~condition)私に次のような出力が得られます。 condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts contrast estimate SE df t.ratio p.value Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099 Condition1 - …

15 r repeated-measures multiple-comparisons post-hoc lsmeans bayesian posterior marginal integral anova time-series regularization machine-learning pca computational-statistics references inference regression cross-validation python random-forest chi-squared spearman-rho r machine-learning confidence-interval bagging clustering feature-selection model-selection bic hypothesis-testing kurtosis r regression residuals terminology

5

線形回帰に既知の理論線と統計的に有意な差があるかどうかを計算するにはどうすればよいですか？

ほぼ直線に沿ったデータがいくつかあります。これらの値の線形回帰を行うと、線形方程式が得られます。 y=0.997x−0.0136y=0.997x−0.0136y = 0.997x-0.0136 理想的な世界では、方程式はなければなりません。y=xy=xy = x 明らかに、私の線形値は理想に近いが、正確ではありません。私の質問は、この結果が統計的に有意であるかどうかをどのように判断できますか？ 0.997の値は1と大きく異なりますか？-0.01 は0と大きく異なりますか？または、それらは統計的に同じであり、私はいくつかの合理的な信頼レベルでと結論付けることができますか？y=xy=xy=x 使用できる良い統計的検定とは何ですか？ありがとう

14 regression hypothesis-testing statistical-significance

4

帰無仮説が真である確率

したがって、これはよくある質問かもしれませんが、満足のいく答えを見つけたことがありません。帰無仮説が真（または偽）である確率をどのように決定しますか？学生にテストの2つの異なるバージョンを与え、それらのバージョンが同等かどうかを確認したいとします。t検定を実行すると、p値が.02になります。なんて素敵なp値でしょう！つまり、テストが同等である可能性は低いということです。いいえ。残念ながら、P（results | null）はP（null | results）を伝えないようです。通常行うべきことは、低いp値に遭遇したときに帰無仮説を棄却することですが、どのようにして、真である可能性が高い帰無仮説を棄却していないことを知ることができますか？馬鹿げた例を挙げると、偽陽性率が.02のエボラのテストを設計できます。50個のボールをバケツに入れて、1個の「エボラ」を書き込みます。私がこれを使って誰かをテストし、彼らが「エボラ」ボールを選んだ場合、p値（P（ボールを選ぶ|エボラがない））は0.02です。私がこれまで考えてきたこと： P（null | results）〜= P（results | null）と仮定すると、いくつかの重要なアプリケーションでは明らかにfalseです。 P（null | results）を知らずに仮説を受け入れるか拒否する–なぜそれらを受け入れるか拒否するのか？私たちが考えていることを偽りのように間違って拒否し、本当のことを本当に受け入れているという点ではありませんか？ベイズの定理を使用する-しかし、どのようにして事前分布を取得しますか？それらを実験的に決定しようとして同じ場所に戻ってしまいませんか？そして、それらをアプリオリに選ぶことは非常にarbitrary意的です。 stats.stackexchange.com/questions/231580/という非常に似た質問を見つけました。ここでの1つの答えは、基本的に、ベイズの質問であるため、帰無仮説が真である確率について尋ねるのは意味がないと言っているようです。たぶん私はベイジアンですから、その質問をしないのは想像できません。実際、p値の最も一般的な誤解は、それらが真の帰無仮説の確率であるということです。この質問を頻繁に行う人として本当に質問できない場合、私の主な質問は＃3です。ループに巻き込まれずに、どのようにして優先順位を取得しますか。編集：思慮深い返信をありがとうございます。いくつかの一般的なテーマに対処したいと思います。確率の定義：これに関する多くの文献があると確信していますが、私の素朴な概念は、「完全に合理的な存在が情報を与えたという信念」や「状況が利益を最大化する賭けのオッズ」のようなものです繰り返され、未知のものは変化することを許された」。 P（H0 |結果）を知ることはできますか？確かに、これは難しい質問のようです。しかし、確率は常に与えられた情報を条件としているため、すべての確率は理論的には知っていると信じています。すべてのイベントは発生するか発生しないため、完全な情報では確率は存在しません。情報が不十分な場合にのみ存在するため、知っておく必要があります。たとえば、誰かがコインを持っていると言われ、ヘッドの確率を尋ねられたら、50％と言います。コインの頭に70％の重みが付けられている場合がありますが、その情報が与えられなかったので、私が持っていた情報の確率は50％でした。私がそれを学んだときに頭に。確率は常に（不十分な）データのセットを条件としているため、編集：「常に」は少し強すぎるかもしれません。確率を決定できない哲学的な質問があるかもしれません。それでも、実際の状況では、「ほぼ決して」絶対的な確実性を持つことはできませんが、「ほぼ常に」最良の推定値があるはずです。

14 probability hypothesis-testing bayesian

5

効果サイズは本当にp値より優れていますか？

応用研究におけるp値ではなく、効果の大きさに依存して報告することに多くの重点が置かれています（例えば、以下の引用）。しかし、p値のような効果サイズがランダム変数であり、同じ実験を繰り返したときにサンプルごとに異なる可能性があるということはありませんか？言い換えれば、どの統計的特徴（たとえば、p値よりもサンプルごとの効果サイズの変動が少ないか）が、p値よりも効果サイズの証拠測定指標を良くするかどうかを尋ねています。ただし、p値とエフェクトサイズを分離する重要な事実に言及する必要があります。つまり、母集団パラメーターがあるため効果の大きさは推定されますが、母集団パラメーターがないためp値は推定されません。私にとって、効果の大きさは、特定の研究分野（人間の研究など）で、さまざまな研究者が開発した測定ツールから得られた経験的知見を共通のメトリックに変換するのに役立つ指標です定量研究クラブ）。たぶん、効果の大きさとして単純な割合をとると、次の（Rの）がp値に対する効果の大きさの優位性を示すものでしょうか？（p値は変更されますが、効果サイズは変更されません） binom.test(55, 100, .5) ## p-value = 0.3682 ## proportion of success 55% binom.test(550, 1000, .5) ## p-value = 0.001731 ## proportion of success 55% ほとんどの効果のサイズは、検定統計量と直線的に関連していることに注意してください。したがって、効果サイズを使用して帰無仮説のテストを行うのは簡単なステップです。たとえば、プレポストデザインから得られたt統計は、対応するCohenのd効果サイズに簡単に変換できます。そのため、Cohenのdの分布は、at分布のスケール位置バージョンにすぎません。引用符： p値は混同されたインデックスであるため、理論上、さまざまなサンプルサイズと100の異なる効果サイズを持つ100の研究はそれぞれ同じ単一のp値を持つことができ、同じ単一の効果サイズを持つ100の研究はそれぞれp値に対して100の異なる値を持つことができます。または p値は、サンプルごとに異なるランダム変数です。。。。したがって、2つの異なる実験、または同じ実験で測定された2つの変数のテストからp値を比較し、一方が他方よりも重要であることを宣言することは適切ではありませんか？引用：トンプソン、B。（2006）。行動統計の基礎：洞察に基づくアプローチ。ニューヨーク、ニューヨーク：ギルフォードプレス。グッド、PI、ハーディン、JW（2003）。統計の一般的なエラー（およびそれらを回避する方法）。ニューヨーク：ワイリー。

14 hypothesis-testing confidence-interval p-value effect-size

2

誤った仕様のもとでの統計的推論

統計的推論の古典的な扱いは、正しく指定された統計が使用されるという仮定に依存しています。つまり、観測データを生成した分布は統計モデル一部です：ただし、ほとんどの場合、これが本当に正しいとは限りません。正しく指定された仮定を破棄すると、統計的推論手順はどうなるのだろうか。P∗(Y)P∗(Y)\mathbb{P}^*(Y)yyyMM\mathcal{M}P∗(Y)∈M={Pθ(Y):θ∈Θ}P∗(Y)∈M={Pθ(Y):θ∈Θ}\mathbb{P}^*(Y) \in \mathcal{M}=\{\mathbb{P}_\theta(Y) :\theta \in \Theta\} 私は1982年にWhiteがML推定値に関する誤った仕様の下でいくつかの仕事を見つけました。その中で、最尤推定量は、分布は、統計モデル内のすべての分布と真の分布\ mathbb {P} ^ *からKL発散を最小化します。Pθ1=argminPθ∈MKL(P∗,Pθ)Pθ1=arg⁡minPθ∈MKL(P∗,Pθ)\mathbb{P}_{\theta_1}=\arg \min_{\mathbb{P}_\theta \in \mathcal{M}} KL(\mathbb{P}^*,\mathbb{P}_\theta)P∗P∗\mathbb{P}^* 信頼セット推定量はどうなりますか？信頼度セット推定量を再現できます。してみましょう δ:ΩY→2Θδ:ΩY→2Θ\delta:\Omega_Y \rightarrow 2^\Thetaセットの推定、可能ΩYΩY\Omega_Yサンプルスペースとである2Θ2Θ2^\Thetaパラメータ空間での電力セットΘΘ\Theta。私たちが知りたいのは、\ deltaによって生成されたセットδδ\deltaが真の分布\ mathbb {P} ^ *を含むイベントの確率P∗P∗\mathbb{P}^*、つまりP∗(P∗∈{Pθ:θ∈δ(Y)}):=A.P∗(P∗∈{Pθ:θ∈δ(Y)}):=A.\mathbb{P}^*(\mathbb{P}^* \in \{P_\theta : \theta \in \delta(Y)\}):=A. ただし、実際の分布\ mathbb {P} ^ *はわかりませんP∗P∗\mathbb{P}^*。正しく指定された仮定は、P∗∈MP∗∈M\mathbb{P}^* \in \mathcal{M}ます。ただし、モデルのどの分布であるかはまだわかりません。ただし、infθ∈ΘPθ(θ∈δ(Y)):=Binfθ∈ΘPθ(θ∈δ(Y)):=B\inf_{\theta \in \Theta} \mathbb{P}_\theta(\theta \in \delta(Y)):=Bは確率Aの下限ですAAA。方程式BBBは、信頼セット推定量の信頼レベルの古典的な定義です。正しく指定された仮定を破棄する場合、BBBは必ずしもAの下限ではなく、AAA実際に関心のある用語は、もはやです。確かに、モデルの指定が間違っていると仮定すると、ほとんどの現実的な状況では間違いなくAAAは0です。これは、真の分布P∗P∗P^*が統計モデル\ mathcal {M}に含まれていないためMM\mathcal{M}です。別の観点から、モデルが誤って指定されている場合にBが何にBBB関連するかを考えることができます。これはより具体的な質問です。モデルの指定が間違っている場合、Bにはまだ意味がありますか。BBBそうでない場合、なぜパラメトリック統計に悩まされるのでしょうか？ White 1982には、これらの問題に関するいくつかの結果が含まれていると思います。残念なことに、数学的な背景がないため、そこに書かれていることをあまり理解できません。

14 hypothesis-testing confidence-interval model frequentist misspecification

2

サンプルサイズが等しくない：呼び出すタイミングが終了する

私は学術雑誌の記事を査読していますが、著者は推論統計を報告しないことの正当性として次のように書いています（2つのグループの性質を明確にしました）。合計で、2,349人中25人（1.1％）がXを報告しました。グループXとグループY（他の2,324人の参加者）を統計的に比較する分析を提示することは適切に控えます。これらの結果は偶然によって大きく引き起こされる可能性があるためです。私の質問は、この研究の著者は、グループの比較に関してタオルを投げ入れることを正当化するのか？そうでない場合、私は彼らに何をお勧めしますか？

14 hypothesis-testing sample-size power-analysis power group-differences

3

p = 5.0％は有意ですか？

今日、p値0.05（正確に）が有意である（アルファ= 5％である）と見なされるかどうかを尋ねられました。私は答えを知りませんでしたが、Googleは両方の答えを出しました。（a）pが5％未満の場合、結果は重要です。（b）pが5％未満または5％の場合、結果は有意です。もちろん、これらのウェブサイトは誰も引用していません。なぜそうすべきなのか-それは常識であり、5％はとにかくarbitrary意的です。しかし、それは生徒に覚えておくべきことを伝えるのに役立ちません。それで、ここに仮説のテストに関する私の必死の質問があります：p値が正確にアルファである場合-結果を有意とみなすかどうか？この場合の正式な引用とは何ですか？どうもありがとうございました

14 hypothesis-testing statistical-significance p-value

3

ロジットまたはプロビットモデルで選択された係数の同時等性をテストする方法は？

ロジットまたはプロビットモデルで選択された係数の同時等性をテストする方法は？標準的なアプローチとは何ですか？また、最先端のアプローチとは何ですか？

14 hypothesis-testing logit probit

タグ付けされた質問 「hypothesis-testing」

タグ付けされた質問「hypothesis-testing」