私はコンピュータビジョンのコースをたどっていて、この演習を行っています。手の画像が与えられると、手を開いているか、閉じているか、パンチを開いているか、または「OK」の姿勢を保持しているかを、これまでに提供された手法(ピクセル4/8接続、接続領域、輪郭検出、穴検出、重心のようなブロブプロパティ、面積、周長、偏心、画像モーメント、反転/パワー/ログ/ガンマ補正/コントラストストレッチのような画像変換、ヒストグラム計算とイコライゼーション)。
私はいくつかの基本的なブロブプロパティでそれを行いました(閉じた手は偏心度が低く、「ok」は穴があります、開いた手はブロブの内接楕円の面積と偏心度が低いブロブ領域自体の間に大きな違いがあります) ..動作するようですが、最初の画像は少し問題があります。
より堅牢なアルゴリズムを作成するために、もっと何かがあると思います。たぶん、ある種のモーメントプロパティ?いくつかのblob軸/方向/極値が役立ちますか?
PSテスト画像: