非常に少ないデータを使用した強力な画像分類モデルの構築に関するブログ投稿では、ボトルネック機能について言及されています。ボトルネック機能とは何ですか?使用するアーキテクチャによって変わりますか?それらは、完全に接続されたレイヤーの前の畳み込みレイヤーの最終出力ですか?なぜそう呼ばれるのですか?
非常に少ないデータを使用した強力な画像分類モデルの構築に関するブログ投稿では、ボトルネック機能について言及されています。ボトルネック機能とは何ですか?使用するアーキテクチャによって変わりますか?それらは、完全に接続されたレイヤーの前の畳み込みレイヤーの最終出力ですか?なぜそう呼ばれるのですか?
回答:
非常に少ないデータを使用した強力な画像分類モデルの構築に関するブログ投稿では、ボトルネック機能について言及されています。ボトルネック機能とは何ですか?
これは、VGG16モデルから「ボトルネック機能」を与えたリンクに明確に記述されています。完全に接続されたレイヤーの前の最後のアクティブ化マップです。
使用するアーキテクチャによって変わりますか?
承知しました。著者は、事前にトレーニングされたモデルを使用した可能性が高い(大規模なデータでトレーニングされ、現在は特徴抽出器としてのみ使用されている)
それらは、完全に接続されたレイヤーの前の畳み込みレイヤーの最終出力ですか?
はい。
なぜそう呼ばれるのですか?
VGGへの入力サイズを考えると、HxWディメンションの機能マップは、すべてのmax-pool操作の後に2倍小さくなります。HxWは、最後のたたみ込み層で最小です。
まず、転移学習について話す必要があります。猫を検出するために画像のデータセットを介して神経回路網を訓練したと想像してください。あなたが行った訓練の一部を使用して、別の何かを検出する別の訓練を行うことができます。それは転移学習として知られています。
転移学習を行うには、最後に完全に接続されたレイヤーをモデルから削除し、そこにレイヤーを接続します。「切り捨てられた」モデル出力は、「モデル」を満たす機能になります。それらはボトルネック機能です。
VGG16は、ImageNetカタログ上のプレトレインモデルであり、精度が非常に優れています。あなたが共有した投稿では、がそのモデルをベースとして使用して、猫と犬をより高い精度で検出しています。
ボトルネック機能はモデルによって異なります。この例では、VGG16を使用しています。VGG19、ResNet-50などの事前トレーニング済みモデルもあります。
モデルをカットして、独自のレイヤーを追加するようなものです。主に、検出したいものを決定する出力層、最終出力。