データ分析の学習を継続するために定期的に時間を投資できるとは思わない
Casella&Bergerは、次の方法でデータを学習する場所だとは思わない データ分析のデータを。統計理論のツールのいくつかを学ぶ場所です。
これまでの統計では、さまざまな分布(ワイブル、コーシー、t、F ...)を含む多くの退屈な計算に耐えなければならない統計学者であることを教えてくれました。
私はデータ分析を行う統計学者として多くの時間を費やしました。退屈な計算を行うことはめったにありません(ほとんどありません)。時々、簡単な代数が必要になりますが、一般的な問題は通常解決され、そのたびに複製するのに労力を費やす必要はありません。
コンピューターはすべての退屈な計算を行います。
適度に標準的なケースを想定する準備ができていない状況(GLMを使用する準備ができていないなど)にいる場合、他の分布を想定するのに十分な情報が通常ないため、 LRTは通常、意味がありません(必要に応じて行うことができますが、すでに解決されている傾向があるか、めったに出ないので興味深い転換です)。
私は多くのシミュレーションを行う傾向があります。また、パラメトリックな仮定の代わりに、またはパラメトリックな仮定の代わりに、何らかの形でリサンプリングを使用することも頻繁に試みます。
以前のように週に20時間以上費やす必要がありますか?
それはあなたが何ができるようになりたいか、そしてどれくらい早くそれを上手になりたいかによって異なります。
データ分析はスキルであり、実践と多くの知識ベースが必要です。すでに必要な知識がいくつかあります。
さまざまなことで優れた実践者になりたい場合は、時間がかかりますが、カセラとベルガーのエクササイズを行う代数などよりもはるかに楽しいと思います。
たとえば、回帰問題は時系列に役立つと言う上で私が築いたスキルのいくつかはそうですが、多くの新しいスキルが必要です。したがって、残差プロットとQQプロットの解釈を学ぶことは便利ですが、PACFプロットの少しの隆起について心配する必要があるかどうかはわかりませんし、1ステップ先の予測を使用するようなツールは提供しませんエラー。
したがって、たとえば、典型的なガンマモデルまたはワイブルモデルの MLを合理的に行う方法を考え出す努力をする必要はありません。
研究をするために来たら、Casella&Bergerのような場所で習得するより多くのスキルが必要になります(しかし、この種のスキルであっても、複数の本を読む必要があります)。
いくつかの提案事項:
他のことを何もしなくても、間違いなく回帰スキルを構築する必要があります。
かなり良い本がたくさんありますが、おそらくドレイパーとスミスの応用回帰分析とフォックスとワイスバーグの応用回帰のRコンパニオンです。また、ハレルの回帰モデリング戦略に従うことを検討することをお勧めします
(ドレーパーとスミスの代わりに良い本をいくつでも代用できます-あなたに合った1つか2つを見つけてください。)
2番目の本には、読む価値のあるオンラインの追加の章が多数あります(および独自のRパッケージ)
-
良い2番目のサービングは、Sを使用した Venables&RipleyのModern Applied Statisticsです。
これは、かなり幅広いアイデアの根拠になっています。
いくつかのトピックでもっと基本的な資料が必要なことがわかるかもしれません(あなたの背景はわかりません)。
次に、ベイジアン統計、時系列、多変量解析など、統計のどの領域が必要/必要かについて考え始める必要があります。