私は最初のプロジェクトをまとめようとしている初心者です。私は歌の分類プロジェクトを念頭に置いていましたが、手動でラベリングするので、約1000曲、つまり60時間の音楽を合理的にまとめることができました。
私はいくつかのクラスで分類しているので、1つのクラスがトレーニングセットで50〜100曲しか持っていない可能性があります。これは少なすぎるようです。ニューラルネットワークのトレーニングに必要なデータ量の一般的な経験則はありますか?
編集:私はバニラLSTMを使用することを考えていました。入力フィーチャの次元は39、出力次元は6になります。隠しレイヤーの次元の最初の試行は100です。