オーディオ処理/分析用のOpenCVの類似ライブラリ


50

OpenCVは、C / C ++で画像処理をプログラミングするための事実上のライブラリです。オーディオ処理用のそのようなCまたはC ++ライブラリがあるかどうか疑問に思っています。基本的に、マイクからの生の波をフィルタリングし、いくつかの機械学習アルゴリズムで分析したいと思います。しかし、私は最終的にも必要になる場合があります:

  • マルチプラットフォームオーディオキャプチャおよびオーディオ再生
  • DSP-オーディオフィルター
  • トーン検出
  • 色調特性分析
  • トーン合成
  • いくつかの認識コーパスとモデルを与えられた認識
  • 音声/音楽合成

アドバイスをいただければ幸いです。

回答:


29

以下を考慮してください。

clam-project.org

CLAM(オーディオおよび音楽用C ++ライブラリ)は、オーディオおよび音楽ドメインでの研究およびアプリケーション開発のための本格的なソフトウェアフレームワークです。オーディオ信号の分析、合成、処理のためのツールと同様に概念モデルを提供します。

マーフ

MARFは、オープンソースの研究プラットフォームであり、Javaで記述され、新しいアルゴリズムの追加を容易にするモジュール式の拡張可能なフレームワークに配置された音声/音声/音声/テキストおよび自然言語処理(NLP)アルゴリズムのコレクションです。MARFはネットワーク上で分散して実行でき、アプリケーションのライブラリとして機能したり、学習や拡張のソースとして使用したりできます。

aubio

aubioは、音声信号から注釈を抽出するために設計されたツールです。その機能には、各攻撃の前にサウンドファイルをセグメント化すること、ピッチ検出を実行すること、ビートをタップすること、ライブオーディオからミディストリームを生成することが含まれます。




8

STK(cufmoが言及したMARSYASはそのプロジェクトの1つです)など、Princeton Sound Labから入手可能なさまざまなコードライブラリをチェックアウトできます。そこにあるさまざまなライブラリの関連機能を組み合わせることで、プロジェクトの目標を達成できる場合があります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.