回答:
私自身もこの立場にある程度いるので、洞察を与えようと思います。
まず、統計学習の要素をダウンロードします。微積分と線形代数を前提とし、非常に技術的ですが、非常によく書かれています。
第二に(または第一に)機械学習に関するAndrew Ngのチュートリアルをご覧ください。
第三に、いくつかのデータを取得し、データの分析を開始します。トレーニングセットとテストセットに分割し、トレーニングセットでモデルを構築し、テストセットに対してテストする必要があります。Rのキャレットパッケージは、これらすべてに非常に役立つことがわかりました。その練習の後、練習を練習します(他のほとんどすべてのように)。
Tan、Steinbech、Kumarによるデータマイニングの紹介は、最高の紹介書です
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
深く掘り下げたいときのためにEoSLを保存します。それはより多くの参照です。
Tom Mitchellによるデータマイニング/機械学習に関する非常に優れたチュートリアルソースを追加するだけです。
彼はそれを非常に明確に説明しており、あなたは彼のプレゼンテーションを彼のウェブサイトからダウンロードすることもできます(彼の講義を見ることもできます)。