商用アプリケーションで使用できるSIFT / SURFの無料の代替品は何ですか?


66

私の知る限り、SURFとSIFTはどちらも特許で保護されています。商用アプリケーションで自由に
使用できる代替方法はありますか?

特許の詳細については、http//opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.htmlをご覧ください


7
(まだ)Euを含んでいません-彼らは唯一のソフトウェア特許許可している国で特許を取得している覚えている
マーティンベケット

1
@MartinBeckett、それは開発、展開、またはその両方をカバーしていますか?
アンドレイRubshtein

2
それはソフトウェア特許についてのトリッキーなことです。特許は、国での製造または販売を停止しますが、研究または開発は停止しません。今、ソフトウェア開発とは何ですか?
マーティンベケット

SIFTで正確に特許されているものは何ですか?SIFTには、(i)スケールスペースの構築、(ii)キーポイント検出器、および(iii)記述子ジェネレーターの3つの段階があります。私の考えでは、Descriptor Generatorのみが特許を取得しています。私は正しいですか?ありがとう

これは、尋ねられた質問に対する答えではなく、したがって、答えではなくコメントに属します。
ThP 14

回答:


62

SIFTとSURFの両方の作成者は、元のアルゴリズムの使用にライセンス料を要求します。

私は状況についていくつかの研究を行ってきましたが、可能な選択肢は次のとおりです。

キーポイント検出器:

  • ハリスコーナー検出器
  • Harris-Laplace-Harris検出器のスケール不変バージョン(MikolajczykとSchmidtによって提示されたアフィン不変バージョンも存在しますが、特許もありません)。
  • マルチスケール指向パッチ(MOP)-特許は取得されていますが、検出器は基本的にマルチスケールハリスであるため、問題はありません(記述子は2Dウェーブレット変換画像パッチです)
  • LoGフィルター-特許取得済みのSIFTは、LoG(Laplacian of Gaussian)のDoG(ガウシアンの差)近似を使用してスケール内の関心点をローカライズするため、LoGのみを修正された特許なしのアルゴリズムで使用でき、実装が少し遅くなる可能性があります
  • 速い
  • BRISK(記述子を含む)
  • ORB(記述子を含む)
  • KAZE-自由に使用できる、M-SURF記述子(KAZEの非線形スケール空間用に修正)、SIFTとSURFの両方よりも優れています
  • A-KAZE-KAZEの高速バージョン、無料、M-LDB記述子(修正された高速バイナリ記述子)

キーポイント記述子:

  • 正規化された勾配-シンプルで実用的なソリューション
  • PCA変換された画像パッチ
  • ウェーブレット変換されたイメージパッチ-詳細はMOPペーパーで提供されますが、特許問題を回避するために異なる方法で実装できます(たとえば、異なるウェーブレットベースまたは異なるインデックススキームを使用)
  • 方向付けられた勾配のヒストグラム
  • GLOH
  • レッシュ
  • ブリスク
  • オーブ
  • フリーク
  • LDB

関心点に方向を割り当て、それに応じて画像パッチを回転させると、回転不変性が無料で得られることに注意してください。ハリスのコーナーでさえ回転に対して不変であり、記述子も同様に作成できます。

Huginでは、より完全な解決策がいくつか実施されています。これは、特許なしの関心点検出器の取得にも苦労したためです。


ご回答有難うございます。彼らはロイヤリティが欲しいですか?
アンドレイRubshtein

1
はい、両方ともロイヤルティ料金が必要です。価格は交渉する必要がありますが、年間約20.000米ドルになり、ロイヤリティ料は約5%です。MOPは現在マイクロソフトによって特許が取得されています(特許に関する詳細についてはRichard Szeliskiに問い合わせました)。
リボール

1
特許は原則として公開されているため、それについて詳しく知りたい場合は、特許データベースで調べてください(例:欧州データベース .
Geerten

それらのキーポイント記述子のいずれかはスケール不変ですか?
ディエゴ

1
Harris-Laplaceはスケール不変です。または、スケールスペースの最大値を除外し、検出された各ポイントの特性スケールを計算することにより、他の検出器のスケールを不変にできます。
リボール

26

比較的新しい方法があります。BRISK、Binary Robust Invariant Scalable Keypointsをご覧ください 。

この論文では、キーポイントの検出、記述、マッチングのための新しい方法であるBRISKを提案します。ベンチマークデータセットの包括的な評価により、最先端のアルゴリズムと同様に、BRISKの適応性のある高品質のパフォーマンスが明らかになりますが、計算コストは​​劇的に低くなります(場合によってはSURFよりも桁違いに速くなります)。スピードの鍵は、各キーポイント近傍の専用サンプリングによって取得された強度比較からのビット文字列記述子のアセンブリと組み合わせた、新しいスケールスペースFASTベースの検出器のアプリケーションにあります。

それは特許なしで自由に使用できます(アルゴリズムの作者によって言われたように)。


12

ここでは誰も信用しないで、弁護士に相談してください。法的世界は私が言うのとは微妙に異なります。正確に何をしたいか(およびどこで)によっては、SURFまたはSIFTを使用できる解決策があります。私は過去に、一見強力なライセンスをどのように克服できるかに驚いていました。


8

KAZE / AKAZEを検討したいと思います。KAZE/ AKAZEは、パフォーマンスが大幅に向上し、同等のパフォーマンスを発揮します。変形ケースも許容されます。OpenCVは最近、GSoC 2014を通じて実装を取得しましたこちらで見つけることができます。OpenCVチュートリアルもここにあります


ありがとう。KAZEは有望に見えます-全体的なパフォーマンスはSIFT / SURFよりも優れています。非線形スケールスケールの計算は実装が難しいかもしれませんが、努力する価値があるかもしれません。
リボール
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.