長さのグラウンドトゥルースを備えた車両の大規模なデータセットがあります(10万サンプル以上)。車両の長さを測定/推定するために深いネットワークをトレーニングすることは可能ですか?ディープニューラルネットワークを使用したオブジェクトサイズの推定に関連する論文は見たことがありません。
長さのグラウンドトゥルースを備えた車両の大規模なデータセットがあります(10万サンプル以上)。車両の長さを測定/推定するために深いネットワークをトレーニングすることは可能ですか?ディープニューラルネットワークを使用したオブジェクトサイズの推定に関連する論文は見たことがありません。
回答:
はい!これは間違いなく可能です。ラベル付けされたデータセットがあるので、それでさらに簡単になります!
私はこのプロジェクトを見てみます。そうすれば、あなたがどこに行く必要があるかがわかるでしょう。
実装の詳細はかなり簡単なはずです。さらにお手伝いできるかどうかお知らせください。
はい、それは可能ですが、最初にあなたが認識する必要がありますいくつかの画像内のオブジェクトを、いずれか1)車両自体、およびその車両の既知のサイズを報告し、または2)車とカメラから同じ距離をだ知られているオブジェクト(縁石、一時停止標識、ドライバーの頭、シェトランドポニーなど)、そのオブジェクトを使用して、それに非常に近い車のサイズを調整します。
画像内の車はカメラからの距離が不明であるため、車のオブジェクトは写真ごとに大きくまたは小さく見えます。車または少なくとも既知のサイズの参照オブジェクトを認識しない場合、車の物理的なサイズは調整されません。サイズの見積もりの根拠はありません。
車が不明な場合は、視覚的な手掛かりがあっても(参照オブジェクトが存在するか、カメラから車までの距離がわかっている場合)、カメラのレンズの広角の未知の範囲が不明な車の形状を歪める可能性があります(高さ対幅)、見かけの寸法を推定する能力がさらに複雑になります。
このペーパーが役立つと思います:ディープラーニングとジオメトリを使用した3Dバウンディングボックスの推定
彼は1台のVGG-19(ImageNetで事前トレーニング済み)を使用して車のサイズを学習しました