実際のケースで、テストの前提をテストせずに、どのように検証するか


9

テストの結果に基づいて使用するテストを選択した場合、結果の複合テストには未知のプロパティ(タイプIおよびIIのエラー率)があるため、正式にはテストの仮定をテストすることはできません。これが、統計への「シックスシグマ」のようなアプローチ(テスト結果に基づく決定木を使用して、使用するテストを選択する)がプロの統計学者の間で悪いラップを得る理由の1つだと思います。

ただし、実際のデータでは、多くの場合、古典的な仮定が適用されない可能性があるサンプルを取得するため、何らかの方法で確認する必要があります。では、実際に仕事や研究で何をしているのですか?非公式チェックを実行します。たとえば、データの分布を見て、tを使用します-経験的分布が歪んでいないように見えるときのテスト?これは私がほとんどの場合行われていると思うものです。ただし、この「非公式テスト」の結果に基づいて決定を行う限り、テストのプロパティに影響を与えます。もちろん、チェックを使用して決定を行わない場合、チェックは役に立たないため、貴重な時間を無駄にしてはいけません。もちろん、正式なテストプロパティは過大評価されており、実際にはそれを信仰する必要はないと私に答えることができます。これが、理論的な背景だけでなく、実際にあなたが何をしているかに興味がある理由です。

別のアプローチは、より少ない仮定で常にテストを使用することです。通常、私が好むよう額装されたこのアプローチを見てきたノンパラメトリック上でテストをパラメトリック以下の前提条件(前者は検定統計量は、パラメータのベクトルでインデックスさ分布の家族から来て、これより堅牢であることを前提としないので、テスト)。これは一般的に正しいですか?このアプローチでは、場合によっては、パワー不足のテストを使用するリスクがありませんか?よく分かりません。適用される統計の有用な(おそらく単純な)参照はありますか?これは、使用するテスト/モデルのリストを、古典的なテスト(t検定、カイ2乗など)のより良い代替として、いつ使用するかを示していますか?


シックスシグマ法は、製造などで繰り返し実行されてきたプロセス用に設計されています。彼らは、カスタムでアドホック、ex novo、または完全に新規なデータ(情報)に関連する問題について、ほとんどまたは何も言いません。これは、本当の知識発見は本質的に危険であり、奉献のために複製が必要であることを意味します。
マイクハンター

回答:


2

私が最も頻繁に行った(そして自分で行う傾向がある)のは、同じ領域の同じ変数の履歴データのセットをいくつか見て、それを基礎として適切なものを決定することです。その際、もちろん、たとえば、回帰残差の正規性からの穏やかな偏差は、計画されたアプリケーションで十分に大きなサンプルサイズが与えられた場合、一般にあまり問題にならないことを覚えておく必要があります。独立したデータを確認することで、タイプIのエラー制御などのテストプロパティを台無しにする問題を回避できます(規制目的の確認臨床試験などの一部の領域では非常に重要です)。(適切な場合)パラメトリックアプローチを使用する理由は、あなたが言うように、効率、


興味深い-より多くのデータセットがある場合は、パワーを上げるために集計しようとしますが、仮定チェックのために集計して履歴データを予約しないことは、興味深い代替案です。また、文献を確認すると役立つ場合があります。パラメトリックアプローチからの効果サイズの推定は解釈が容易であるという事実に明確に同意します。
DeltaIV 2016

1
製薬業界から来たと思いますが、私はさまざまな薬の試験について考えていました。厳密なタイプIのエラー率制御が不要で、内部の意思決定のための方が多い場合、他の薬剤の以前の試験を使用して、制御グループの事前取得を行うこともできますが、通常は、新薬の新しい試験。それは私の特定の視点を説明するかもしれません。
ビョルン

0

個人的には、パラメトリックテストとそれに対応するノンパラメトリックテストを実行し、それぞれの仮定を一度にテストするのが好きです。パラメトリックテストの仮定に大幅に違反していない場合、またはノンパラメトリックテキストで同様の結果が得られた場合は、パラメトリックテストを使用します。パラメトリック仮定に違反している場合でも、有意な結果が得られれば、違反によってテストが弱体化されたため、それらにかなりの自信を持たせることができます。さらに、正直に言って、「グループAの平均ランクスコアはグループBの平均ランクスコアより12高い」などの結果を意味のある解釈をするのは困難です。


パラメトリックテストの仮定をテストし、前者の仮定に違反したときにノンパラメトリックを使用する場合、それ以外の場合はパラメトリックに戻すと、未知のプロパティの複合テストを効果的に使用できます。これは重要な問題ではないと思いますか?いくつかのノンパラメトリック検定の結果を解釈することの難しさについては同意します。たとえば、マンホイットニーウィルコクソンでは、スケールと位置が混同されますが、これは確かに解釈を単純化しません。
DeltaIV 2016

1
正直なところ、そのようには考えていませんでした。それは良い点を高めます。しかし、結局のところ、少なくとも私が行う作業では、テストの仮定に大幅に違反しない明確に理解できる結果が最大の関心事だと思います。とにかく人々は統計を理解するのに十分な時間を費やす傾向があります。
JRF1111 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.