タグ付けされた質問 「hypothesis-testing」

仮説検定では、データがランダムな変動の影響ではなく、特定の仮説と矛盾しているかどうかを評価します。

4
測定の不確かさを組み込んだ統計的検定
y1とy2と呼ばれる2つのグループの質量測定値(mg)が与えられたとします。2つのサンプルが平均の異なる母集団から抽出されたかどうかを確認するテストを実行したいと思います。たとえば、次のようなもの(Rの場合): y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6) y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9) t.test(y1,y2) 0.3234のp値が得られ、0.05の有意水準では、2つのグループが同じ平均の母集団から抽出されているという帰無仮説を棄却しません。今、私は各測定の不確実性を与えられています: u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2) u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3) ここで、u1 [1]は測定値y1 [1](など)の結合された標準不確かさです。これらの不確実性を統計的検定に組み込むにはどうすればよいですか?

6
Rのur.df(Dickey-Fullerユニットルートテスト)の結果の解釈
パッケージのur.df()関数を使用して、時系列で次の単体ルートテスト(Dickey-Fuller)を実行していurcaます。 コマンドは次のとおりです。 summary(ur.df(d.Aus, type = "drift", 6)) 出力は次のとおりです。 ############################################### # Augmented Dickey-Fuller Test Unit Root Test # ############################################### Test regression drift Call: lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag) Residuals: Min 1Q Median 3Q Max -0.266372 -0.036882 -0.002716 0.036644 0.230738 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) …

5
2つの分析方法が同等であることを示す方法は何ですか?
マトリックス内の特定の分子の濃度を測定できる2つの異なる分析方法があります(たとえば、水中の塩の量を測定します) 2つの方法は異なり、それぞれに独自のエラーがあります。2つの方法を示すためにどのような方法が存在するかは、同等(または同等)です。 両方の方法で測定された多数のサンプルの結果を散布図にプロットすることは良い第一歩だと思いますが、良い統計的方法はありますか?

2
電力が非常に低い「難解な」統計テストはありますか?
バックグラウンド コンピュータサイエンス、数学、およびその他の分野では、「難解な」例は面白いだけでなく、特定の概念を説明するのに役立ちます。たとえば、 BogosortとSlowsortは、特に他のソートアルゴリズムと比較すると、アルゴリズムのプロパティを理解するために使用できる非常に非効率的なソートアルゴリズムです。 難解なプログラミング言語は、プログラミング言語の概念がどれほど広範囲に及ぶかを示し、優れたプログラミング言語を評価するのに役立ちます。 ワイエルシュトラス関数とディリクレ機能は、主に継続性の概念についての特定の誤解を説明するために使用を見出します。 私は現在、仮説検定の使用に関するいくつかの指導を準備しており、非常に低い検出力(ただし他の欠陥はない)での検定が統計的検出力の概念を説明するのに役立つと思います。(もちろん、私は、与えられた例が私の聴衆にとって教訓的に有用であるのか、それとも混乱するだけなのかを自分自身で決定する必要があります。) 実際の質問 意図的に低電力の統計テストはありますか? テストは仮説テストの一般的なフレームワークに適合します。つまり、このテストは帰無仮説で機能し、要件があり、(正しい)p 値を返します。 深刻なアプリケーションを対象としたものではありません。 それは非常に低い電力を持っています(意図的な設計上の欠陥によるもので、サンプルや効果のサイズが低いためではありません)。 そのようなテストは存在できないと根本的に主張できるのであれば、これも私の質問に対する有効な回答だと思います。一方、そのようなテストが多数存在する場合は、最も教育的に効率的なテストに興味があります。つまり、簡単にアクセスでき、目立つ効果があるはずです。 私はことに注意してください統計ミスの一般的な選択を求めない(チェリー・ピッキングなど)、または類似。 これまでに見つけたもの インターネット検索で何も返されませんでした。 このようなものを構築するすべての試みは、いくつかの(有用な)既存のテストで終了するか、形式が通常のテストの形式ではありません。たとえば、母集団の正の中央値がすべてのサンプルが正の場合にのみ「はい」を返すかどうかのテストについて考えました。しかし、そのテストはp 値を返さないため、通常のテストフレームワークには適合しません。正と負の符号を検定統計量として数えるだけで( それに応じてp値を計算する)、合理的な検定である符号検定で終了します。

2
2つの平均を比較するためにt検定の代わりに分散分析を使用することは間違っていますか?
給与の分布があるので、男性と女性の平均の違いを比較したいと思います。2つの平均を比較するための学生のT検定があることは知っていますが、分散分析を提案した後、分散分析は3つ以上の平均を比較するためのものであるという批判を受けました。 2つだけの手段を比較するためにそれを使用することで何が(もしあれば)間違っていますか?

1
仮説検定と科学的方法
このスレッドへの回答を読んで、私は仮説検定が科学的方法とどのように関連しているか疑問に思い始めました。私は両方をよく理解していますが、両者を正確に結び付けるのに苦労しています。 高レベルでは、科学的方法は次のようになります。 推測と仮説を立てる(理論) この理論から予測する 実験と観察を行う 新しい理論をテストして受け入れる場合 データは、代替理論よりも正確に(より)予測に適合します 新しい理論は他のもっともらしい選択肢よりも複雑ではありません 大まかに言えば、科学的手法はこのように、統計的仮説検定の「不合格の場合は拒否」アプローチと対照的な「適合の場合は合格」アプローチに従うと私には思われます。これは正しいです?もしそうなら、なぜこれが当てはまるのですか?どちらも基本的に同じ目標を追い求めているのではありません。観察を最もよく説明する理論またはモデルを推測しますか?

2
p値の微妙さ:大きいか大きいか
Wassermannの本「All of Statistics」を読んでいると、p値の定義に微妙な違いがあることに気づきました。非公式には、Wassermannはp値を次のように定義します。 [..] 実際に観測されたものと同じかそれより極端な検定統計量の値を観測する確率(下)。H0H0H_0 強調が追加されました。同じことをより正式に(定理10.12): サイズテストが次の形式であるとします。αα\alpha リジェクト場合にのみT (X N)≥ C α。H0H0H_0T(Xn)≥cαT(Xn)≥cαT(X^n) \ge c_\alpha そして、 p-value=supθ∈Θ0Pθ0[T(Xn)≥T(xn)]p-value=supθ∈Θ0Pθ0[T(Xn)≥T(xn)]\text{$p$-value} = \sup_{\theta\in\Theta_0} P_{\theta_0}[T(X^n) \ge T (x^n)] ここで、はX nの観測値です。もしΘ 0 = { θ 0 }次に 、P -値 = P θ 0 [ T (X N)≥ T (X N)]xnxnx^nXnXnX^nΘ0={θ0}Θ0={θ0}\Theta_0=\{\theta_0\}p-value=Pθ0[T(Xn)≥T(xn)]p-value=Pθ0[T(Xn)≥T(xn)]\text{$p$-value} = P_{\theta_0}[T(X^n) \ge T (x^n)] さらに、ワッセルマンはピアソンのp値を定義として試験(及び同様に他のテスト)。χ2χ2\chi^2 p-value=P[χ2k−1>T].p-value=P[χk−12>T].\text{$p$-value} …

1
別のテストの結果に基づいて仮説テストを実行することに関する論文
p値を解釈するのが困難または不可能であるため、別の統計的検定の結果に基づいて統計的検定を選択することが問題になることはよく知られています(たとえば、別の結果(たとえば、正規性)に基づいて統計的検定を選択する) 。ただし、これは依然として多くのアプリケーションで標準的な方法であり、通常、適用された論文では気づかれず、議論もされていないようです。文献を調べたところ、この現象について実際に説明している論文は見つかりませんでした。 別の統計的検定の結果に基づいて統計的検定を選択することに関連する出版物、特に応用科学者がアクセスできる出版物へのリンクをいただければ幸いです。

2
t検定と一元配置分散分析はどちらもWald検定ですか?
正規分布サンプルの平均が定数に等しいかどうかをテストするt検定は、サンプル平均での正規分布の漁師の情報によってサンプル平均の標準偏差を推定することにより、Waldテストと呼ばれます。しかし、t検定の検定統計量にはスチューデントのt分布があり、Wald検定の検定統計量には漸近的にカイ二乗分布があります。どう説明したらいいの? 一元配置分散分析では、検定統計量はクラス間分散とクラス内分散の間の比率として定義されます。Waldテストでもあるのかと思っていました。ただし、一元配置分散分析の検定統計量にはF分布があり、ワルド検定の検定統計量には漸近的にカイ二乗分布があります。どう説明したらいいの? よろしくお願いします!

4
ベイジアンの情報のない事前分布と頻度主義の帰無仮説:関係とは?
こちらのブログ投稿でこの画像を見つけました。 この声明を読んでも、この男の場合と同じ顔の表情を引き出せなかったことにがっかりした。 では、帰無仮説は、常連客が情報のない先を表現する方法であるという声明の意味は何ですか?本当ですか? 編集:私は誰かが、少し緩い意味でさえ、声明を真実にする慈善的な解釈を提供できることを望んでいます。

3
Zスコアとp値の違いは何ですか?
ネットワークモチーフアルゴリズムでは、統計に対してp値とZスコアの両方を返すことはよくあるようです。「入力ネットワークにはサブグラフGのXコピーが含まれています」。サブグラフは、それが満たされる場合、モチーフと見なされます p値<A、 Zスコア> Bおよび X> C、一部のユーザー定義(またはコミュニティー定義)A、B、およびC。 これが質問の動機です。 質問:p値とZスコアの違いは何ですか? そしてサブ質問: 質問:同じ統計のp値とZスコアが反対の仮説を示唆する状況はありますか?上記の1番目と2番目の条件は基本的に同じですか?

3
彼らがあなたに矛盾する結果を与えるとき、どちらがより良い研究であるかを検出する方法は?
あなたはしばしば方向性が逆の結果を結論付ける様々な研究に新聞に出くわします。それらは、新しい処方薬のテストや特定の栄養素のメリットなど、その問題に関連している可能性があります。 そのような2つの研究が矛盾する結果に達したとき、2つのうちどちらが真実に最も近いかをどのようにして知ることができますか?


2
フィッシャーの正確確率検定はどの分布を想定していますか?
私の仕事では、フィッシャーの正確確率検定のいくつかの使用法を見てきましたが、それが自分のデータにどれだけうまく適合するかと思っていました。いくつかの情報源を見て、統計の計算方法を理解しましたが、仮定された帰無仮説の明確で正式な説明を見たことはありません。 誰かが私に仮定された分布の正式な説明を説明したり参照したりできますか?分割表の値に関する説明に感謝します。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.