タグ付けされた質問 「hypothesis-testing」

仮説検定では、データがランダムな変動の影響ではなく、特定の仮説と矛盾しているかどうかを評価します。

2
統計テストはゼロのp値を返すことができますか?
ゼロに近い値(統計ソフトウェアによってゼロに丸められる)を意味するのではなく、文字通りゼロの値を意味します。もしそうなら、帰無仮説が真であると仮定して得られたデータを取得する確率もゼロであることを意味しますか?この種の結果を返すことができる統計テストの例(いくつかの例)は何ですか? 2番目の文を編集して、「帰無仮説の確率」というフレーズを削除しました。

3
「検定統計量」は値またはランダム変数ですか?
私は今、最初の統計コースを受講している学生です。「テスト統計」という用語に混乱しています。 以下(一部の教科書でこれを見ました)では、は特定のサンプルから計算された特定の値であるようです。 tttt=x¯¯¯−μ0s/n−−√t=x¯−μ0s/n t=\frac{\overline{x} - \mu_0}{s / \sqrt{n}} ただし、以下では(他の教科書でこれを見ました)、はランダム変数のようです。 TTTT=X¯¯¯¯−μ0S/n−−√T=X¯−μ0S/n T=\frac{\overline{X} - \mu_0}{S / \sqrt{n}} それでは、用語「検定統計量」は特定の値またはランダム変数、あるいはその両方を意味しますか?

2
「仮説のテスト」と「有意性のテスト」の違いは何ですか?
「仮説のテスト」と「有意性のテスト」というフレーズに違いはありますか、それとも同じですか? @Micheal Lewからの詳細な回答の後、最近の仮説(たとえば、平均を検定するt検定)が「有意性検定」または「仮説検定」の例であるという混乱があります。それとも両方の組み合わせですか?簡単な例でそれらをどのように区別しますか?

4
平均のロバストt検定
ランダム変数に対して、軽度から中程度のスキューとランダム変数の尖度の影響を受けるローカル代替に対して、ヌルをテストしようとしています。「ロバスト推定と仮説検定入門」でのウィルコックスの提案に従って、トリミングされた平均値、中央値、および位置のM推定量(Wilcoxの「ワンステップ」手順)に基づいた検定を見てきました。これらの堅牢なテストは、歪んでいないがレプトクルティックな分布でテストする場合、パワーの点で標準のt検定よりも優れています。E [ X ] > 0 XE[ X] = 0E[X]=0E[X] = 0E[ X] > 0E[X]>0E[X] > 0バツXX ただし、偏った分布でテストする場合、これらの片側検定は、分布が左スキューであるか右スキューであるかに応じて、帰無仮説の下で非常にリベラルまたは保守的すぎます。たとえば、観測値が1000の場合、中央値に基づくテストでは、実際には、公称5%レベルで、時間の約40%が拒否されます。この理由は明らかです。歪んだ分布では、中央値と平均値はかなり異なります。しかし、私のアプリケーションでは、中央値ではなく、平均値をテストする必要があります。 平均を実際にテストするt検定のより堅牢なバージョンはありますが、スキューと尖度の影響を受けませんか? 理想的には、この手順は、スキューのない、尖度の高いケースでもうまく機能します。「1ステップ」テストはほぼ十分で、「bend」パラメーターは比較的高く設定されていますが、スキューがない場合のトリム平均テストよりも強力ではなく、スキュー下のリジェクトの公称レベルを維持するのに問題があります。 背景:中央値ではなく平均値を本当に気にする理由は、テストが金融アプリケーションで使用されるからです。たとえば、ポートフォリオに正の期待対数収益があるかどうかをテストする場合、ポートフォリオに投資すると、すべての収益(平均サンプル数)が発生するため、平均は実際に適切です中央値の重複。つまり、私は本当にRVからのドローの合計に関心があります。n XnnnnnnバツXX

3
回帰におけるnullモデルとは何ですか?またnull仮説とどのように関係しますか?
回帰におけるnullモデルとは何ですか?nullモデルとnull仮説の関係は何ですか? 私の理解のために、それは意味します 「応答変数の平均」を使用して連続応答変数を予測しますか? 離散応答変数の予測に「ラベル分布」を使用していますか? その場合、帰無仮説間の関係が欠落しているようです。

2
p値の分布の大きな分散(Taleb 2016の議論)
Taleb、2016、The Meta-Distribution of Standard P-Valuesでなされた全体像の主張を理解しようとしています。 その中で、Talebは(私が理解しているように)p値の信頼性について以下の議論をしています: ある分布Xからのデータポイントを操作する推定手順は、p値を出力します。この分布からさらにn個のポイントを引き出して別のp値を出力する場合、これらのp値を平均して、いわゆる「真のp値」を限界値で取得できます。nnnXXX この「真のp値」は非常に高い分散を持っていることが示されているため、「真のp値」分布+プロシージャは、60%の時間で<.05のp値を報告します。.12.12.12 質問:値を支持して、これを従来の議論とどのように調和させることができますか。私が理解しているように、p値はあなたの手順があなたに正しい間隔(または何でも)を与える時間の割合を教えてくれるはずです。ただし、このペーパーでは、手順を再度実行するとp値が同じにならないため、この解釈は誤解を招くと主張しているようです。ppp ポイントが足りませんか?

2
「これらのデータポイントはすべて同じ分布からのものです。」テスト方法
ここで説明したこのトピックを見たことはありますが、具体的なものを見つけることができませんでした。繰り返しになりますが、何を検索すればよいのかよくわかりません。 順序付けられたデータの1次元セットがあります。セット内のすべてのポイントは同じ分布から引き出されると仮定します。 この仮説をどのようにテストできますか?「このデータセットの観測値は2つの異なる分布から得られる」という一般的な代替案に対してテストするのは妥当ですか? 理想的には、どのポイントが「その他」の分布からのものかを特定したいと思います。データが順序付けられているので、データを切り取るのが「有効」かどうかを何らかの方法でテストした後、切り取り点を特定することはできますか? 編集:Glen_bの答えによると、私は厳密にポジティブな単峰分布に興味があります。また、分布を仮定し、さまざまなパラメーターをテストするという特別なケースにも興味があります。

4
P値を誤解していますか?
したがって、P値を正しく解釈する方法について多くのことを読んでおり、私が読んだことから、p値は帰無仮説が真または偽である確率について何も言っていません。ただし、次のステートメントを読む場合: p –値は、タイプIエラーを犯す確率、または真である場合に帰無仮説を拒否する確率を表します。p値が小さいほど、帰無仮説を誤って拒否する可能性が小さくなります。 編集:そして5分後に読んだ: P値の誤った解釈は非常に一般的です。最も一般的な間違いは、P値を、真の帰無仮説(タイプIエラー)を拒否することにより間違いを犯す確率として解釈することです。 これは私を混乱させました。どちらが正しいか?そして、誰もがp値を正しく解釈する方法と、それがタイプIエラーを起こす確率に適切にどのように関連するかを説明できますか?

1
FDRの制御がFWERの制御よりも厳しくないのはなぜですか?
Wikipediaのように、FDRの制御はFWERの制御よりも厳しくないことを読みました。 FDR制御手順は、Familywise Error Rate(FWER)手順(Bonferroni修正など)と比較して、誤った発見に対する厳格な制御を行いません。これにより、タイプIのエラー率が増加しますが、パワーが増加します。つまり、効果があるという帰無仮説を受け入れるべきときに拒否します。 しかし、数学的にどのように真実であることが示されているのだろうか? FDRとFWERの間に何らかの関係がありますか?

3
変数が同じ分布に従うかどうかをテストします
2つの変数が同じ分布に従うかどうかをテストする場合は、両方の変数を単純に並べ替えてから、それらの相関を確認するのが良いでしょうか?高い(少なくとも0.9?)場合、変数は同じ分布からのものである可能性が高いです。 ここでの分布とは、「正規」、「カイ二乗」、「ガンマ」などを意味します。

2
両側検定の説明
私は、生徒に(初等統計学コースで)両側検定とは何か、またそのP値がどのように計算されるかを説明するさまざまな方法を探しています。 両側検定と片側検定を生徒にどのように説明しますか?

1
Kolmogorov-Smirnovを使用して2つの経験的分布を比較できますか?
Kolmogorov-Smirnov適合度検定を使用して、1つの経験的分布を事前に指定された参照分布と比較するのではなく、2つの経験的分布を比較して、それらが同じ基礎となる分布に由来するように見えるかどうかを判断しても大丈夫ですか? これを別の方法で聞いてみましょう。1つの場所でいくつかの分布からN個のサンプルを収集します。別の場所でM個のサンプルを収集します。データは連続的です(各サンプルは0から10までの実数です)が、正規分布ではありません。これらのN + Mサンプルがすべて同じ基礎となる分布に由来するかどうかをテストしたいと思います。この目的のためにコルモゴロフ-スミルノフ検定を使用するのは合理的ですか? F0F0F_0NNNF1F1F_1MMMF0F0F_0F1F1F_1D = supバツ| F0(x )− F1(x )|D=supバツ|F0(バツ)−F1(バツ)|D = \sup_x |F_0(x) - F_1(x)|DDD (適合度のコルモゴロフ-スミルノフ検定は離散分布には有効ではないことを別の場所で読みましたが、これが何を意味するのか、なぜそれが真実であるのか理解できないと認めています。 ) または、代わりに何か他のものをお勧めしますか?

5
ANOVAの仮定の確認
数か月前に、SOのRでの同分散性テストに関する質問を投稿しましたが、Ian Fellowsが答えました(彼の答えは非常に大まかに言い換えます)。 モデルの適合度をテストするとき、同相性テストは良いツールではありません。小さなサンプルでは、​​ホモ分散性からの逸脱を検出するのに十分なパワーがありませんが、大きなサンプルでは「十分なパワー」があるため、平等からの些細な逸脱でもスクリーニングする可能性が高くなります。 彼の素晴らしい答えは私の顔に平手打ちとして来ました。以前は、ANOVAを実行するたびに、正規性と同分散性の仮定をチェックしていました。 あなたの意見では、ANOVAの仮定をチェックするときのベストプラクティスは何ですか?

5
ペアの観測値の分散の比較
私がしている観測(ペア、有限の第一及び第二モーメントを有する共通の未知の分布から引き出された)を、平均の周りに対称です。NNNバツ私バツ私X_iY私Y私Y_i してみましょうの標準偏差(上の無条件の)、および Y.私のために同じことが仮説を検証したいと思います σバツσバツ\sigma_XバツバツXYYYσYσY\sigma_Y H0H0H_0:σバツ= σYσバツ=σY\sigma_X = \sigma_Y H1H1H_1:σバツ≠ σYσバツ≠σY\sigma_X \neq \sigma_Y 誰でもそのようなテストを知っていますか?最初の分析では、分布が正規であると仮定できますが、一般的なケースの方が興味深いです。閉じた形式のソリューションを探しています。ブートストラップは常に最後の手段です。

2
T分布が線形回帰係数の仮説検定に使用されるのはなぜですか?
実際には、標準のT検定を使用して線形回帰係数の有意性を確認するのが一般的です。計算の仕組みは私にとって理にかなっています。 T分布を使用して、線形回帰仮説検定で使用される標準検定統計量をモデル化できるのはなぜですか?私がここで言及している標準の検定統計量: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.