名前、サイズ、ハッシュが異なる重複したmp3を削除する


9

大規模な音楽ライブラリ(すべてmp3)を持っていますが、一部の音楽はほぼ同じですが、

  1. おそらく1秒か2秒長い
  2. 別の曲と同じで約97%
  3. または別のビットレート。

これらの重複を見つける方法はありますか?前述のように、サイズ、名前、SHA1ハッシュが同じではありません。

回答:


3

Echoprintと呼ばれるオープンソースの音響指紋システムがあります。大きなコレクションを重複排除したいことを確認したい場合があります。私はこれを以前に使用したことがありません(偶然見つけただけです)が、これをローカルで実行できるのは素晴らしいことです。


これとは関係なく、ファイルに適切なタグが付けられている場合(名前でファイル名やID3タグを意味するかどうかはわかりません)、タグに基づいて機能する重複排除ツールもあります。
エイドリアンFrühwirth2013

6

MusicBrainzのPicardを使用します。音楽をスキャンして「指紋」を生成し、オンラインデータベースと比較して識別します(アーティスト、アルバムなどのすべての情報を引き出します)。

曲が識別されたら、それらをカスタムのディレクトリと名前の構造に編成し、それを使用して重複を見つけることができます。

Linuxと完全に互換性があります。


これは明確な方法です。
slm

わかりました、問題があると思います。私の音楽はどれもコマーシャルではありません。そのほとんどは、JamendoからダウンロードしたCCライセンスです。それは一致を見つけることができないと言います。
Hans Groeffen 2013

@HansGroeffenでは、それが問題になります。以前は不明だった音楽のフィンガープリントを公開することを許可されているので、それを行うことができますが、提出が正確であることを検証するために努力する必要があります。名前が一致しないため、これは良い考えではないかもしれません。フィンガープリントと比較の機能のためだけに使用する方法があるかどうかはわかりません。
Patrick

2
MusicBrainzのデータベースピカードが使用するには、ユーザーが編集可能です。アーティスト、作品(曲)、リリース(アルバム/ EP)の新しいエントリを作成し、Picardを使用してファイルのタグを付け直したり移動したりできます。それは少しの努力ですが、それは機能します-そしてそれは他の人に役立ちます。
naught101

3

プラグインbeetsと一緒に使用することをお勧めしduplicatesます。beets似ているpicard(それはMusicBrainzのデータベースからID3情報を検索し、その情報に基づいてファイルを整理することができます)の機能の観点ではなく、そのプラグインのいくつかでピカールの能力を超えました。

個人的に私はそれらを一緒に使用します-ID3タグのクリーンアップとファイルの整理と重複のクリーンアップのためのビート。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.