基本的な機械学習では、次の「経験則」を学びます。
a)データのサイズは、仮説セットのVCディメンションのサイズの少なくとも10倍にする必要があります。
b)N個の接続を持つニューラルネットワークのVC次元は約Nです。
ディープラーニングニューラルネットワークが数百万のユニットを言うとき、これは、たとえば数十億のデータポイントが必要であることを意味しますか?これに光を当ててください。
ディープニューラルネットワークには、数百万個のユニットはありません。ただし、何百万もの接続があります。これらのネットワークでは、主に正規化された性質(ドロップアウトのあるCNNなど)により、2番目の経験則は当てはまらないと思います。
—
pir
重要なのは、VCの限界は無限ではないということです。有限である場合、PAC理論は学習が実行可能であることを示しています。データ量。これは別の質問です。
—
ヴラディスラフドブガレス