回答:
率直に言って、私は多数の法則が産業において大きな役割を果たしているとは思わない。最尤推定値やテスト(特に重要なGLMとロジスティック回帰を含む)、ブートストラップなどの一般的な手順の漸近的な正当化を理解することは役立ちますが、これらは悪いサンプルの問題に遭遇する確率ではなく、分布の問題です。
既に述べたトピック(GLM、推論、ブートストラップ)を超えて、最も一般的な統計モデルは線形回帰であるため、線形モデルを完全に理解する必要があります。業界でANOVAを実行することは決してありませんが、それを理解していない場合は、統計学者と呼ばれるべきではありません。
産業にはさまざまな種類があります。製薬業界では、無作為化試験とロジスティック回帰なしに生計を立てることはできません。調査統計では、Horvitz-Thompson推定量と無応答調整なしで生計を立てることはできません。コンピュータサイエンス関連の統計では、統計学習とデータマイニングなしで生計を立てることはできません。公共政策のシンクタンク(そして、ますます教育統計)では、因果関係と治療効果の推定量(ますます、無作為化試験を含む)なしで生計を立てることはできません。マーケティングリサーチでは、経済学の背景と心理測定の理論とを組み合わせる必要があります(また、一般的な統計部門のサービスではどちらも学べません)。産業統計は、主流の統計とは遠隔的に接続されている独自の6シグマパラダイムで動作します。より強い結合は、実験材料の設計で見つけることができます。ウォール街の材料は、確率論的計算までの金融計量経済学です。これらは非常に異なるスキルであり、「産業」という用語は「アカデミア」よりもさらに不十分に定義されています。上記の2つまたは3つ以上を同時に知っていると主張できる人はいないと思います。
ただし、「業界」で普遍的に必要とされる最高のスキル(それがあなたにとって何であれ)は、時間管理、プロジェクト管理、および統計に精通していないクライアントとのコミュニケーションです。そのため、業界での就職に備えたい場合は、これらのトピックに関するビジネススクールのクラスを受講してください。
更新:元の投稿は2012年2月に作成されました。最近(2014年3月)、業界での熱い仕事を見つけるために、「統計学者」ではなく「データ科学者」と呼ぶべきでしょう。そして、その自己宣言で従うべきHadoopをもっとよく学ぶべきです。
バイアスと分散のトレードオフに関連する問題をよく理解していると思います。ほとんどの統計学者は、ある時点で、推定値の分散またはモデルのパラメーターが十分に高く、バイアスが二次的な考慮事項となるほど十分に小さいデータセットを分析することになります。
これは、大数の法則や中心極限定理のようなものに非常に似ているとは言いませんが、因果関係について推論することが中心であることが多いため、構造化グラフを使用して因果関係をモデル化するジュディアパールの仕事を理解することは、人々が知っておくべきことですと。実験的研究と観察的研究が与える因果関係の推論に関してなぜ異なるのかを理解する方法を提供し、観測データを扱う方法を提供します。概要については、彼の本はこちらです。
カジュアルな推論が必要です。そして、それが根本的な問題であることに対処する方法は、時間をさかのぼることができず、誰かに治療を与えることはできません。ルービンについての記事を読んで、現代の統計学の学生の創始者です。)....この問題に対処するために学ぶべきこと、適切なランダム化、そして多数の法則が物事が適切にランダム化されることをどのように言うか、仮説検定、潜在的結果そして、欠損()に優れています)、マッチング(欠損に対しては優れていますが、より一般化されているため、潜在的な結果が優れています.1つの複雑なことしか学べないのに、なぜ多くの複雑なことを学ぶのか)、ブートストラップ、もちろんベイジアン統計(ベイジアン回帰、ナイーブベイジアン回帰、ベイジアン因子)、および非パプメトリック代替。
通常、実際にはこれらの一般的な手順に従ってください。
以前のコメントに関しては、一般的に最初にANOVA(ランダム効果または固定効果、連続型をビンに変換)から始めて、回帰を使用する必要があります(変換および変更を行うとANOVAと同じくらい良いが、決して勝てない場合があります)どの特定の治療が重要であるかを確認するには、(複数のt検定を行い、ホルムメチドのような補正を使用することに任せて)回帰を使用します。
物事を予測する必要がある場合は、bayasian回帰を使用します。
5%を超える欠損は潜在的な結果を使用します
データ分析のもう1つのブランチは、言及されなければならない教師あり機械学習です。