複数のクラスの人(人)とともに段ボール箱を検出する方法をニューラルネットワークにトレーニングしようとしています。
人を検出し、正しく分類するのは簡単ですが、段ボール箱を検出するのは非常に困難です。
ボックスは次のようになります。
私の疑いは、ボックスがオブジェクトに対して単純すぎることです。オブジェクトから抽出する機能が少なすぎるため、ニューラルネットワークはそれを検出することが困難です。
データセットの分割は次のようになります。
personA: 1160
personB: 1651
personC: 2136
person: 1959
box: 2798
人は、分類されているアイテムに基づいてさまざまな安全アイテムを着用していますが、アイテムだけでなく、人全体として検出されています。
私が使用しようとしました:
ssd300_incetpionv2
ssd512_inceptionv2
faster_rcnn_inceptionv2
これらはすべて、箱よりもはるかに優れた人物の検出と分類です。正確には提供できませんmAP
(それがありません)。
何か案は?
ありがとう。