CNNでflow_from_directoryを使用する場合のデータ拡張


7

小さなデータセットを使用してCNNモデルを作成したい。それで、私は訓練データセットを増やすためにデータ増強を使用しています。ここにリストさているすべての拡張手法(引数)を使用する必要がありますか?

多くの引数を追加すると、モデルの精度が低下し、トレーニングセットがテストセットよりも難しくなることに気づきました。

使用時にデータ拡張を使用するためのベストプラクティスは何flow_from_directoryですか?

回答:


6

拡張機能は、多くの場合、データの性質に依存しています。増強の結果があなたのコンテキストで論理的であると想像してみてください。

たとえば、猫と犬のデータセットがあるとします。ここの画像は左から右に反転できます。一方、MNISTデータセットでは、画像を反転することはまったく意味がありません(反転した「3」をモデルに供給するのはどんなに良いことでしょう)。一部の拡張機能は、実際にモデルを混乱させる可能性があります(たとえば、「9」の逆さまは「6」のように見える場合があります)。

[5

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.