ロゴ検出にAIまたはニューラルネットワークを使用する


10

私はビデオファイル内のTVチャネルのロゴを検出しようとしています。そのため、単純に入力.mp4ビデオを与え、そのロゴが特定のフレーム、たとえば最初のフレームにあるかどうかを検出します。

事前にそのロゴがあり(%100と同じサイズではない場合があります)、場所は常に固定されています。

私はすでにパターンマッチングベースのアプローチを採用しています。ただし、そのためには、パターンを同じサイズの100%にする必要があります。それを実現するために、ディープラーニングとニューラルネットワークを使用したいと思います。どうやってやるの?CNNの方が効率が高いと思いますか?


1
AIへようこそ!素晴らしい主題。
DukeZhou

1
@DukeZhou Tnx!いくつかのサンプルコードへのポインタで適切な答えが得られることを願っています。
Tina J

回答:


5

画像認識を実行するには、特定の機能を備えた画像を表現する方法を見つける必要があります。

優れた画像認識アルゴリズムの特徴の1つは、顕著な領域、つまり最も多くの情報を含む領域を検出できることです。

現在、コンテンツベースの画像分類のディープラーニングには多くの注意が向けられています。各層が画像の1つ以上の特徴の抽出を担当するCNNの3つ以上の層を持つ深層学習を実装することにより、適切な結果を得ることができます。


ありがとう。私自身はCNNの人ではありません。しかし、ロゴ画像を与えられたソースコードへのポインタはありますか、それが存在するかどうかを検出できますか?
Tina J

3
ねえ、Satoj KovicによるGithubのDeepLo​​goをチェックしてください。Pythonで書かれており、CNNを使用してブランドロゴを認識します。以下のリンクを掲載しました。乾杯。github.com/satojkovic/DeepLo​​go
Seth Simba

3

それはビデオ入力であり、ハードウェアまたはソフトウェアのいずれかによってライブまたは記録されたフレームの上に重ねられるため、ロゴは通常静止していますので、タスクは難しくありません。また、ロゴは通常、カラーパレットが限定され、エッジがくっきりしています。彼らが単語や頭字語を綴るとき、彼らのフォントの特徴は通常あまりにも一貫しています。これらは、深層学習で利用できる一般性です。

この著者が投稿した他の同様の質問と同様に、LSTMレイヤーとCNNレイヤーの組み合わせをトレーニングして、ロゴを見つけて分離することができます。いくつかの画像トリックを使用すると、ロゴの背後の画像も、同様の一連の学習手法を通じて、ロゴの周囲のピクセルから妥当な精度と信頼性で再構築できます。

これらは、開発のいくつかの開始点です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.