シンプルなテクニックのみを使用したジェスチャー認識


8

私はコンピュータビジョンのコースをたどっていて、この演習を行っています。手の画像が与えられると、手を開いているか、閉じているか、パンチを開いているか、または「OK」の姿勢を保持しているかを、これまでに提供された手法(ピクセル4/8接続、接続領域、輪郭検出、穴検出、重心のようなブロブプロパティ、面積、周長、偏心、画像モーメント、反転/パワー/ログ/ガンマ補正/コントラストストレッチのような画像変換、ヒストグラム計算とイコライゼーション)。

私はいくつかの基本的なブロブプロパティでそれを行いました(閉じた手は偏心度が低く、「ok」は穴があります、開いた手はブロブの内接楕円の面積と偏心度が低いブロブ領域自体の間に大きな違いがあります) ..動作するようですが、最初の画像は少し問題があります。

より堅牢なアルゴリズムを作成するために、もっと何かがあると思います。たぶん、ある種のモーメントプロパティ?いくつかのblob軸/方向/極値が役立ちますか?

PSテスト画像:

ok2

OK

開いた

パンチ


スケルトン化を使用できますか?その他のアイデアについては、関連するウィキペディアの記事を参照してください。
Emre

これは将来のクラスの内容なので許可されません!
nkint 2013年

Symbolic Aggregate approXimationを各オブジェクトの外側の輪郭に適用してみることができます。基本的に、複雑な形状を時系列に削減し、それらを何らかの方法でクラスター化します。
Ivo Flipse 2013年

私は..私は機械学習のいずれかの種類を使用する必要はありませんだと思い、質問に書かれたissesを結合するだけでスマートな方法
nkint

多分いくつかの形態学的特徴?
nkint 2013年

回答:


2

Huの不変の瞬間を見てみることができます。それらは基本的なモーメントから構築でき、回転、スケール、反射、並進不変です。

最初に一連のトレーニング輪郭に対してそれらを計算し、次にそれらをテスト輪郭に適用します。

私が覚えている限り、MatlabとOpenCVには実装があります。


2

本「Pythonによるコンピュータービジョンのプログラミング」によると、興味深いアプローチは、画像に高密度SIFT(別名HoG)機能を使用し、これらの機能を分類器に送ることです。

私は自分で試したわけではありませんが、アプローチとしてはかなり健全に思えます。さらに、HoG機能の発明者は、私のテストで非常にうまく機能したFlutterアプリを提案しており、発明者が独自の機能または密接な派生物を使用しなかったとしたら、非常に奇妙です。


2

私の友人の一人が彼の学部論文のためにこれをしました。彼が基本的に行ったのは、各ジェスチャーのプロパティをエンコードすることでした。たとえば、最初の図では、手の部分の上に長方形のマスクを取ります。スキンが長方形のマスクエッジに接する部分に注意し、マークを付ける必要があります。次に、大きい方のエッジと小さい方のエッジの相対位置を比較できます。

したがって、上向きの場合は、上向きのエッジが小さく、手首のエッジが大きくなります。

横向きの場合、片側に小さいエッジがあり、下側に大きいエッジがあります。

少なくとも方向はこの方法でカバーできます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.