タグ付けされた質問 「hypothesis-testing」

仮説検定では、データがランダムな変動の影響ではなく、特定の仮説と矛盾しているかどうかを評価します。

2
非劣性テストでnullを受け入れることはできますか?
通常のt検定では、通常の仮説検定法を使用して、nullを拒否するか、nullを拒否できませんが、nullを受け入れません。その理由の1つは、より多くの証拠を得た場合、同じ効果サイズが重要になることです。 しかし、非劣性テストではどうなりますか? あれは: H0:μ1−μ0≤xH0:μ1−μ0≤xH_0: \mu_1 - \mu_0 \le x 対 H1:μ1−μ0>xH1:μ1−μ0>xH_1: \mu_1 - \mu_0 > x ここで、は、基本的に同じと見なす量です。我々はヌルを拒否するのであれば、我々はと言うより大きくなる少なくともによって。証拠が不十分な場合、ヌルを拒否できません。 μ 1 μ 0のxxxxμ1μ1\mu_1μ0μ0\mu_0xxx 効果サイズが以上の場合、これは通常のt検定に類似しています。しかし、サンプルのエフェクトサイズがより小さい場合はどうなりますか?次に、サンプルサイズを増やして同じ効果を維持した場合、それは重要ではありません。したがって、この場合はnullを受け入れることができますか?xxxxxxx

5
ダービン・ワトソン検定の統計
Rの回帰モデルにDWテストを適用し、1.78のDWテスト統計と2.2e-16 = 0のp値を得ました。 これは、統計値が2に近く、p値が小さいため、残差間に自己相関がないことを意味しますか、それとも、統計値が2に近いにもかかわらず、p値が小さいため、存在するという帰無仮説を棄却します自己相関なし?

1
Wilcoxonの符号付き順位検定は、t検定または符号検定のどちらよりも望ましい状況ですか?
いくつかの議論(下記)の後、焦点の合った質問のより明確な画像が得られたので、ここに改訂された質問がありますが、コメントの一部は元の質問と関係がないように見えるかもしれません。 と思われるt検定は、対称分布のために迅速に収束することを、符号付き順位検定は、対称性を仮定し、そしてそれは、対称的な分布のために、手段/ pseudomedians /中央値の間に違いはありません。もしそうなら、どのような状況下で、比較的経験の浅い統計学者は、t検定と符号検定の両方を利用できるときに、符号付き順位検定が役立つと思いますか?私の(例えば社会科学)生徒の1人が、ある治療が別の治療よりも優れているかどうかをテストしようとしている場合(比較的簡単に解釈される測定、たとえば、「平均」差の概念によって)、署名する場所を見つけるのに苦労しています-私の大学では、一般的に教えられているように見えますが、ランクテストは無視されています。

2
参照リクエスト:働くデータサイエンティストのための古典的な統計
私は、回帰、その他の機械学習タイプのアルゴリズム、およびプログラミング(データ分析と一般的なソフトウェア開発の両方)において確かな経験を持つ、データサイエンティストとして働いています。私の仕事のほとんどは、予測精度(さまざまなビジネス上の制約の下での作業)のためのモデルの構築と、自分(および他の人)の仕事をサポートするデータパイプラインの構築に焦点を当てています。 私は統計学の正式な訓練を受けておらず、大学の教育は純粋な数学に焦点を当てています。そのため、古典的なトピックの多く、特に人気のあるさまざまな仮説検定と推論手法の学習に失敗しました。 私の経歴と経験レベルを持つ人に適した、これらのトピックへの参照はありますか?私は数学的な厳密さを扱い(そして理解し)、アルゴリズムの観点も楽しむことができます。私は、数学とプログラミングの両方(またはいずれか)に焦点を当てた、読者ガイド付きの演習を提供するリファレンスを好む傾向があります。


5
ノンパラメトリック検定(例:順列検定)で相互作用効果をテストする方法は?
私は2つのカテゴリ変数/名義変数を持っています。それぞれが2つの異なる値のみを取ることができます(したがって、合計で4つの組み合わせがあります)。 値の各組み合わせには、数値のセットが付属しています。だから、私は4セットの数字を持っています。より具体的にするために、私は名目変数として、および従属数値「出力」として持っているmale / femaleとyoung / oldしましょうweight。 からmaleへの移行femaleによって平均体重が変化し、これらの変化が統計的に有意であることを知っています。だから、gender因子を計算することができます。同じことがage変数にも当てはまります。からyoungへの移行oldによって平均重量が変わることは知っていますage。対応する係数を計算できます。 さて、若い女性から古い男性への移行が、性別と年齢の要因の組み合わせよりも多いことがデータで証明されているかどうか、私が本当に確認したいのは、つまり、「2Dの影響」があること、つまり年齢と性別の影響が独立していないことをデータが証明しているかどうかを知りたいのです。たとえば、男性の場合は年齢が上がると体重が1.3増加し、女性の場合は対応する係数が1.1になる可能性があります。 もちろん、私は2つの言及された要因(男性の年齢係数と女性の年齢係数)を計算でき、それらは異なります。しかし、私はこの違いの統計的有意性を計算したいと思います。この違いはどれほど本物ですか。 できれば、ノンパラメトリック検定をしたいのですが。4つのセットを混合し、シャッフルし、再分割して計算することで、やりたいことを実行できますか?

3
方向独立変数による正規分布DVの関連付けのテスト?
正規分布従属変数が方向分布変数に関連付けられているかどうかの仮説検定はありますか? たとえば、時刻が説明変数である場合(そして、曜日、月などのようなものは無関係であると想定)、つまり、午後11時が午前1時より 22時間進んでいること、および2が2 であることを説明する方法です。時間の背後にある関連のテストで午前1時?真夜中の12:00が午後11:59の1分後に続かないと仮定せずに、連続した時刻が従属変数を説明するかどうかをテストできますか? このテストは、離散方向(モジュラー)の説明変数にも適用されますか?それとも別のテストが必要ですか?たとえば、従属変数が月によって説明されるかどうかをテストする方法(日と季節、および特定の年または10年は無関係であると想定)。年の月を処理すると、順序は無視されます。ただし、月を標準の序数変数として扱う(たとえば、Jan = 1 ... Dec = 12)と、1月が11月の2か月後に来ることは無視されます。

3
カテゴリ変数の人気のある、または一般的な組み合わせを見つけるために使用できる統計的方法は何ですか?
多剤使用の研究をしています。私は400人の麻薬常用者のデータセットを持っています。10種類以上の薬物が存在するため、可能な組み合わせは大きくなります。私はそれらが消費する薬物の大部分をバイナリ変数に再コード化しました(つまり、薬物中毒者がヘロインを乱用した場合、ヘロインは1で、それ以外は0です)。2つまたは3つの薬物の人気のある、または一般的な組み合わせを見つけたいのですが。使用できる統計的方法はありますか?

2
ネットワーク(グラフ)が「小さな世界」のネットワークであるかどうかを統計的にテストするにはどうすればよいですか?
スモールワールド・ネットワークは、ほとんどのノードが互いに隣国ではありませんが、ほとんどのノードは、ホップまたは少ない工程数で、他のすべてのから到達することができる数学的なグラフの種類です。具体的には、スモールワールドネットワークは、ランダムに選択された2つのノード間の距離L(必要なステップ数)がネットワーク内のノード数Nの対数に比例して増加するネットワークとして定義されます。 L ≈ ログ(N)L≈log⁡(N) L \approx \log(N) LとNの間のこの関係は「経験則」です。私の研究では、小さな世界のグラフをより専門的に決定したいと思っています。自分のグラフが小さな世界のグラフであるかどうかをどのようにテストできますか? スモール・ワールド現象は、スタンレー・ミルグラムと米国の人々の社会的ネットワークの平均経路長を調べる他の研究者が行ったいくつかの実験を構成しました。この研究は、人間の社会が短い経路長を特徴とする小さな世界タイプのネットワークであることを示唆しているという点で画期的でした。ミルグラムは自分でこの用語を使用していませんが、実験はしばしば「6つの分離度」というフレーズに関連付けられています。 前もって感謝します。

2
ダービン-ワトソンを除いて、どの仮説検定が決定的な結果を生み出しませんか?
ダービン・ワトソン検定統計量は、それが(この場合、ゼロ自己相関の)帰無仮説を拒絶する拒絶するか失敗するか不可能である不確定領域内に位置することができます。 「決定的でない」結果を生み出す可能性がある他の統計的検定 この一連のテストがバイナリの「拒否」/「失敗の拒否」の決定を行うことができない理由についての一般的な説明はありますか? 誰かが後者のクエリへの回答の一部として意思決定理論上の影響に言及できたら、それはおまけです—結論の(追加の)カテゴリの追加は、タイプIとタイプIIのコストを考慮する必要があることを意味しますかより洗練された方法でエラー?

1
Rの「前の状態」が「後の状態」に影響を与えるかどうかをテストする方法
状況を想像してみてください。3つの鉱山の歴史的な記録(20年)があります。銀の存在は来年金を見つける確率を高めますか?そのような質問をテストする方法は? 以下はデータの例です。 mine_A <- c("silver","rock","gold","gold","gold","gold","gold", "rock","rock","rock","rock","silver","rock","rock", "rock","rock","rock","silver","rock","rock") mine_B <- c("rock","rock","rock","rock","silver","rock","rock", "silver","gold","gold","gold","gold","gold","rock", "silver","rock","rock","rock","rock","rock") mine_C <- c("rock","rock","silver","rock","rock","rock","rock", "rock","silver","rock","rock","rock","rock","silver", "gold","gold","gold","gold","gold","gold") time <- seq(from = 1, to = 20, by = 1)

1
混合効果モデルと固定効果モデルの比較(変量効果の有意性のテスト)
正の連続であると、およびカテゴリカルであるの3つの変数を考えるyとx、次のz2つの候補モデルが与えられます。 fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) ) そして fit.fe <- lm( y ~ 1 + x ) これらのモデルを比較して、どちらのモデルがより適切かを判断したいと思います。ある意味fit.feで内にネストされているように思えますfit.me。通常、この一般的なシナリオが当てはまる場合、カイ2乗検定を実行できます。ではR、次のコマンドでこのテストを実行できます。 anova(fit.fe,fit.me) 両方のモデルに(パッケージlmerから生成されたlme4)ランダム効果が含まれている場合、anova()コマンドは正常に機能します。境界パラメーターがあるため、通常は、結果として得られるカイ2乗統計量をシミュレーションでテストすることをお勧めします。それでも、シミュレーション手順で統計量を使用できます。 両方のモデルに固定効果のみが含まれている場合、このアプローチ---および関連するanova()コマンド---はうまく機能します。 ただし、上記のシナリオのように、1つのモデルにランダム効果が含まれ、削減モデルに固定効果のみが含まれる場合、anova()コマンドは機能しません。 具体的には、次のエラーが発生します。 > anova(fit.fe, fit.me) Error: $ operator not defined for this S4 class 上から(シミュレーションで)カイ二乗アプローチを使用することに問題はありますか?あるいは、これは単に、anova()さまざまな関数によって生成された線形モデルを処理する方法を知らないという問題ですか? 言い換えれば、モデルから導出されたカイ2乗統計量を手動で生成することが適切でしょうか?もしそうなら、これらのモデルを比較するための適切な自由度は何ですか?私の計算で: F= ((SSER …

3
線形回帰モデルまたは非線形回帰モデルの間の決定
線形回帰モデルと非線形回帰モデルのどちらを使用するかをどのように決定すべきですか? 私の目標はYを予測することです。 単純なおよびyデータセットの場合、散布図をプロットすることで、どの回帰モデルを使用するかを簡単に決定できました。xxxyyy ような多変量の場合。。。x nおよびy。どの回帰モデルを使用する必要があるかをどのように決定できますか?つまり、単純な線形モデル、または2次、3次などの非線形モデルの使用をどのように決定しますか?x1,x2,...xnx1,x2,...xnx_1,x_2,...x_nyyy どの回帰モデルを使用する必要があるかを推論して決定するための手法、統計的アプローチ、またはグラフィカルプロットはありますか?

2
Holm-BonferroniよりもBonferroniを使用する理由
ボンフェローニ修正よりもホッホベルグ法などのより強力な方法を使用しない理由がわかります。この場合、仮説の独立性などの追加の仮定があるためですが、なぜそうするのかわかりません後者はより強力であり、Bonferroniよりも多くの仮定を持たないため、Holmの逐次拒否的修正に対してBonferroni修正を使用してください。私は何かを見逃しましたか?

2
データが指数分布に適合する2つのサンプルの平均を比較する方法
データの2つのサンプル、ベースラインサンプル、および処理サンプルがあります。 仮説は、処理サンプルの平均がベースラインサンプルよりも高いというものです。 どちらのサンプルも指数関数的です。データはかなり大きいので、テストを実行するときの各サンプルの要素の平均と数しかありません。 どうすればその仮説を検証できますか?私はそれが非常に簡単であると思います、そして私はF-Testを使用するためのいくつかの参照に出くわしましたが、パラメーターがどのようにマップされるかわかりません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.