私はディープラーニングの本を読んでいて、次のパラ(109ページ、2番目のパラ)に出くわしました。
トレーニングデータとテストデータは、データ生成プロセスと呼ばれるデータセットの確率分布によって生成されます。通常、集合的にiid仮定と呼ばれる一連の仮定を作成します。これらの仮定は、各データセットの例が互いに独立していること、およびトレーニングセットとテストセットが同じように分布しており、互いに同じ確率分布から抽出されていることです。この仮定により、1つの例の確率分布を使用してデータ生成プロセスを説明できます。次に、同じ分布を使用して、すべてのトレインの例とすべてのテストの例を生成します。その共有された基礎となる分布をデータ生成分布と呼び、。この確率論的フレームワークとiidの仮定により、トレーニングエラーとテストエラーの関係を数学的に研究できます。
誰かがこの段落の意味を説明してくれませんか?
122ページの最後の段落では、例も示しています
サンプルのセット 平均を伴うベルヌーイ分布に従って独立して同一に分布している 。
これは何を意味するのでしょうか?
ここでは、さらに具体的な質問をいくつか示します。
データセットの確率分布:データセットとは何ですか?確率分布はどのように生成されますか?
例は互いに独立しています。例が依存している場所の例を教えてもらえますか?
互いに同じ確率分布から引き出されます。確率分布がガウスであると仮定します。「同じ確率分布」という用語は、すべての例が同じ平均と分散のガウス分布から抽出されることを意味しますか?
「この仮定は私たちを可能にします」。これは何を意味するのでしょうか?
最後に、122ページの最後の段落では、サンプルがベルヌーイ分布に従うことが示されています。これは直感的にどういう意味ですか?