私はPython、scikit-learn、kerasを使用しています。次のような前面時計の画像が30万枚あります: Watch_1、Watch_2、Watch_3。
入力として実際の時計の写真を受け取って、上の写真よりも理想的ではない状況で撮影したプログラム(異なる背景色、暗い稲妻など)を書き、それに3000の時計の中で最も類似している時計を見つけたいと思います。同様に、薄いレースの丸い茶色の時計の写真を入力として与えると、丸い形の暗い色の薄いレースの出力時計として期待されます。
これを行うための最も効率的な機械学習アルゴリズムは何ですか?
たとえば、このリンクをたどることで、2つの異なる解決策を考えています。
1)CNNを特徴抽出器として使用し、入力画像を参照して、画像のすべてのペアについてこれらの特徴間の距離を比較します。
2)シャムニューラルネットワークで2つのCNNを使用して画像を比較する。
これらの2つのオプションは、このタスクに最適なオプションですか、それとも他のことを提案しますか?
このタスクについて、事前にトレーニングされたニューラルネットワーク(事前に定義されたハイパーパラメーターを使用)を知っていますか?
これについてStackOverflowで興味深い投稿をいくつか見つけましたが、それらはかなり古いです:Post_1、Post_2、Post_3。