場合によっては、理論が最適に機能することは明らかです(マウスの尾の長さはおそらく正規分布しています)。
テールの長さは確かに正規分布ではありません。
正規分布は、負の値をとる確率がゼロではありません。尾の長さはそうではありません。
George Boxの有名なライン、「すべてのモデルは間違っているが、いくつかは有用である」がポイントをかなりよくしている。(単なる近似の正規性ではなく)合理的に正規性を主張するケースは非常にまれであり、伝説のほとんどの生き物であり、気楼は時々目の隅からほとんど見えます。
多くの場合、データセットを説明する理論はおそらくないので、最初に説明するために開発されたものに関係なく、あなたがかなり持っているものに合うものを使用しますか?
関心のある量が選択に特に敏感ではない場合(分布の幅広い特徴が既知のものと一致している限り)、はい、かなり適切なものを使用できます。
感度が高い場合、「適切なものを使用する」だけでは十分ではありません。特定の仮定を行わないアプローチを使用する場合があります(おそらく、置換、ブートストラップ、その他のリサンプリングアプローチなどの配布のないプロシージャ、または堅牢なプロシージャ)。あるいは、シミュレーションなどを介して、分布の仮定に対する感度を定量化することもできます(実際、これは一般的に良い考えだと思います)。
わからない場合は、経験的分布を使用する必要があるかもしれないという問題があるようです。
私は問題としてそれを説明しません-経験的分布に基づく推論は確かに多くの種類の問題に適した正当なアプローチです(順列/ランダム化とブートストラップは2つの例です)。
誰かがこの問題についてアプローチ/思考する一貫した方法を持っていますか?
概して、多くの場合、次のような質問を検討する傾向があります。
1)このフォームのデータに対する手段(または他のロケーションタイプの数量)の動作について、私は何を理解していますか?
*(理論、この形式のデータの経験、または専門家のアドバイス、または必要に応じてデータ自体からかどうか。ただし、それには対処しなければならない問題があります)
2)スプレッド(分散、IQRなど)について-動作はどうですか?
3)他の分布特性(境界、歪度、離散性など)はどうですか
4)依存関係、母集団の異質性、時折非常に矛盾する値などの傾向について
この種の考慮事項は、通常のモデル、GLM、その他のモデル、または堅牢なまたは配布のないアプローチ(ランクベースの手順を含むブートストラップまたは置換/ランダム化アプローチなど)の選択をガイドする可能性があります