ニューラルネットワークをトレーニングするときに、トレーニング例が少なすぎますか?


14

私は最初のプロジェクトをまとめようとしている初心者です。私は歌の分類プロジェクトを念頭に置いていましたが、手動でラベリングするので、約1000曲、つまり60時間の音楽を合理的にまとめることができました。

私はいくつかのクラスで分類しているので、1つのクラスがトレーニングセットで50〜100曲しか持っていない可能性があります。これは少なすぎるようです。ニューラルネットワークのトレーニングに必要なデータ量の一般的な経験則はありますか?

編集:私はバニラLSTMを使用することを考えていました。入力フィーチャの次元は39、出力次元は6になります。隠しレイヤーの次元の最初の試行は100です。


2
すべてのタスクが簡単であるわけではなく、さまざまなネットワークアーキテクチャとハイパーパラメータの選択により、さまざまな方法でさまざまなモデルが改善/破損されるため、これは実際には解決できません。
シコラックスは、モニカを復活させる

少なくとも、ネットワーク構造とトレーニングするリンクの数を指定する必要があります。
GUNG -復活モニカ

回答:


16

本当にデータセットとネットワークアーキテクチャに依存します。私が読んだ経験則の1つ(2)は、ニューラルネットワークが非常に良好に機能し始めるために、クラスごとに数千のサンプルでした。

実際には、人々は試してみます。1000サンプルより少ないトレーニングセットで適切な結果を示す研究を見つけることは珍しくありません。


より多くのトレーニングサンプルを取得することがどの程度有益であるかを大まかに評価する良い方法は、たとえば(1)から、トレーニングセットのサイズに基づいてニューラルネットワークのパフォーマンスをプロットすることです。

ここに画像の説明を入力してください


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.