機械学習を使用して画像分類を行っています。
トレーニングデータ(画像)があり、そのデータをトレーニングセットと検証セットに分割するとします。また、ランダムな回転とノイズ注入によってデータを増強します(元の画像から新しい画像を生成します)。拡張はオフラインで行われます。
データ増強を行う正しい方法はどれですか?
最初にデータをトレーニングセットと検証セットに分割し、次にトレーニングセットと検証セットの両方でデータ拡張を行います。
最初にデータをトレーニングセットと検証セットに分割してから、トレーニングセットでのみデータの拡張を行います。
最初にデータのデータ増強を行い、次にデータをトレーニングと検証セットに分割します。
1
「データ拡張」には複数の意味があります。質問を編集してどちらが自分のものかを明確にするか、単に例を挙げてください。
—
Scortchi-モニカの復職
TTAを実行する予定の場合は、テストセットに関する検証セットに拡張機能を適用する必要があります。
—
アビーヨーカー