画像認識


11

商業的に使用できる2D画像の膨大で有機的に成長するコレクションで画像認識を行うことができるオープンソースシステムを探しています。

  • 画像のスケーリングサイズ、
  • 写真の撮る角度、
  • カラー同期オフセット。つまり、ソースイメージのキャプチャとレンダリングの不規則性のために、インスタンスごとに色が異なります。
  • 写真のトリミング、
  • 透かしやテキストの追加、
  • 可能性のあるフォーカスのバリエーション。つまり、キャプチャーにフォーカスがなかったことを意味し、画像操作フィルターが適用されていません。

アプリケーションをトレーニングしなければならないことは問題ありませんが、そうすることで利益が得られる限り、長期的には、2Dインスタンスの数が最初の数千から数百を超えると予想されます数千; しかし、それは長期的であり、1000インスタンスのトレーニングセットとインスタンスあたり10サンプルのトレーニングセットで十分に理解できるソリューションがあれば幸いです。

更新:ライセンスは、バイナリを持っているすべての人の内部でさえ、ソースコードのリリースなしで商用内部配布に使用できる必要があります。コードが販売されることはなく、内部で使用されるだけですが、すべてのユーザーがソースコードにアクセスできるわけではなく、インターフェイスだけにアクセスできます。


2
OpenCVを検討しましたか?

+1 @pwny:ありがとう-いいえ、私はコンピュータビジョン(CV)システムを試したことはありません。問題について私が考えている方法が正しいかどうかを知りたいだけです。私は画像の内容を述べますが、それはビジネスベンチャーに関連しており、CVシステムは内部でのみ使用されるため、システムが何を処理するかについては述べないようにしていますが、問題は直面します。OpenCVが現在の要件を満たしている場合は、回答として投稿し、可能であれば、提供されている機能要件をカバーする関連ドキュメントへのリンクを試みてください。もう一度、ありがとう!

1
著作権法によると、「内部配布」などはありません。したがって、ほとんどのライセンス(私が知っているすべてのライセンス)は、その点で制限を気にしません。
MSalters 2012

+1 @MSalters:ありがとうございます。「著作権法に従って」へのリンクはありますか?これは、米国著作権法で述べられているように思われますが、コメントを読んでいるだけかもしれません。

1
@blunders:技術的には、法人(例:法人)が自然人のように扱われるべきであることを確立するTRIPS(第1.3条)からです。
MSalters 2012

回答:


10

それは少し低レベルかもしれませんが、OpenCVはそのような画像認識ソフトウェアを構築するために必要なツールを提供するかもしれません。もちろん、OpenCVには必要なものがすべて用意されているわけではありませんが(私はプロではないと思います)、リアルタイムのコンピュータービジョンに必要なものを提供することを目的としています。

ここからドキュメントを読むことができます。いくつかの良い本もそのページにリストされています。

これがお役に立てば幸いです。


OpenCVのGPLV2ライセンスは、クローズドソースシステム内で内部的に配布できないことを意味しますか?ありがとう!

GPLV2ライセンスはどこにありますか?ホームページの最初の段落では、BSDライセンスとしてリストされています。

@deterb:フッター、ページの一番下。

@deterb:GPLリンクはOpenCVではなくOpenCVのWikiに使用されているMoinMoin Wikiエンジン用であると思われます-エラーを指摘していただきありがとうございます!

+1 @pwny:指摘したように、OpenCVはBSDライセンスの下にあり、これはWebサイトのホームページに記載されています(フッターGPLV2ライセンスはOpenCVには適用されないようです)。また、OpenCVをダウンロードしてこれを確認し、それはすべてファイルです。BSDライセンスであるとは記載されていませんが、BSDライセンスの形式でOpenCV用であるように見える他のサードパーティライセンスを返します。だから、それを続けると、あなたの答えは大きな助けとなり、前進するのに十分なようです。ありがとう!


2

ディスカッションに追加するために、私は現在イメージマッチングに取り組んでおり、OpenCVのORBは無料であることがわかりました。ただし、SURFとSIFTはそうではありません。この例を出発点として見ることができます。


1

Pastec http://www.pastec.ioは、最初の質問の要件を満たす必要があります。

これは、LGPLの下でリリースされた画像認識用のオープンソースインデックスおよび検索エンジンです。単純なHTTP APIを使用して、インデックス内の一致する画像を簡単に追加、削除、検索できます。これはOpenCVに基づいており、ORB記述子を使用します。これは、SURFやSIFTとは異なり、特許がありません。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.