タグ付けされた質問 「self-study」

3
データサイエンスを自己学習する方法 [閉まっている]
閉じた。この質問はより集中する必要があります。現在、回答を受け付けていません。 この質問を改善したいですか?この投稿を編集するだけで1つの問題に焦点を当てるように質問を更新します。 4年前に閉鎖されました。 私は独学のWeb開発者であり、自分でデータサイエンスを教えることに興味がありますが、どのように始めるべきかはわかりません。特に、私は疑問に思っています: データサイエンスにはどのような分野がありますか?(例:人工知能、機械学習、データ分析など) 推奨できるオンラインクラスはありますか? 私が実践できるプロジェクトがありますか(オープンデータセットなど)。 申請または完了できる認定資格はありますか?

1
勾配ブースティングツリー:「変数が多いほど良い」?
XGBoost のチュートリアルから、各ツリーが成長すると、すべての変数がスキャンされてノードが分割され、最大のゲイン分割を持つ変数が選択されると思います。だから私の質問は、いくつかのノイズ変数をデータセットに追加すると、これらのノイズ変数は変数の選択に影響しますか?私の論理では、これらのノイズ変数は最大ゲイン分割をまったく提供しないため、それらが選択されることはなく、ツリーの成長に影響を与えません。 答えが「はい」の場合、「変数が多いほどXGBoostに適している」というのは本当ですか?トレーニング時間は考慮しません。 また、答えが「はい」の場合、「モデルから重要でない変数を除外する必要がない」というのは本当です。 ありがとうございました!

2
VC次元と自由度の関係
私は機械学習を勉強していて、VC次元の概念と自由度のより古典的な(統計的)概念の間に強い関係があると感じています。 誰かがそのようなつながりを説明できますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.