「Lena」、「Mandrill」、「Cameraman」などの画像の音声相当物は何ですか?


21

これらの画像を何と呼ぶか​​わかりませんが、画像処理の世界では、特定の操作の出力を表示するための標準的な例として頻繁に使用されています。Lenaを「標準テストイメージ」として説明しているページへのリンクを次に示します。特定のオーディオフィルターまたは操作の効果を示すために使用される類似の標準的なオーディオクリップはありますか?

回答:


17

私が考えることができる最も近い例は、MPEG-1レイヤー3開発に使用されたスザンヌベガの"Tom's Diner"の始まりであり、オーディオコーデックのデモにも時々使用されています。


3
ああ、Tom's Dinerは、ピッチ検出プログラムのテストに役立つ、かなりクリーン(リバーブなし)でモノフォニックの歌声スニペットです。もう1つは、ビートルズの「昨日」のカバーのボーイズIIメンクリップです(最後の最後)。モノフォニックボーカルのピッチトラッキングに適しています。Tom's Dinerよりも厳しいです。Digital Performerがそれを使用したことを覚えています。
ロバートブリストージョンソン14年

16

オーディオ処理は大きな分野ですが、特に音声処理では、ハーバードセンテンスとして知られるサンプルのオープンデータベースが広く使用されています。ハーバード文は、アメリカ英語の音声的にバランスのとれた文の集まりです。他の言語にも多くの同等のデータベースが存在します。

Harvard Sentencesのスピーチを含む実際のファイルは、ここにあります


5

NISTデータベースは、音声認識タスクに関して非常に人気があると思います。実際、これは毎年のチャレンジにおける新しいアルゴリズムとテクニックの比較の標準です。

さらにload handelGFHandel-Hallelujahのスニペットを含むMATLAB が非常に一般的に使用されています。



2

0 dBFSで1 kHz正弦波のパワーを過小評価しないでください。モノで。信号パスで間違っている多くのことはそれで見つけることができます。

私は1 kHzをかなり正確に鳴らすことができる十分なオーディオシステムを構築し、調整しました。シンプルなメモリから。

それ以外に、ドナルドフェイゲンのIGYはテストトラックとして非常に人気があり、多くのフェスティバルで禁止されています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.