重複した曲を見つけるにはどうすればよいですか?


31

タイトルはそれをすべて言います。メディアライブラリで重複を検出するにはどうすればよいですか?

回答:


24

dupeGuru Music Editionはあなたが望むものです。環境設定でスキャンタイプを「オーディオコンテンツ」に設定します。このプログラムはフェアウェアですので、できれば貢献してください。

代替テキスト

これをMusicBrainz Picard組み合わせて、音楽ファイルに自動的にタグを付けることをお勧めします。

代替テキスト


完璧!最後に、魅力のように働いた答え:)。Bansheeプラグインまたはそれ以上のものがあればよかったのですが、これはうまく機能します!実際に、8GBのだまし取りを削除しました。
インゴ

2
ひどいdupeGuruは、一度に10件しか削除できず、お金を出せません。
ジョンマッキーンプルイット

PPAは、最近のUbuntuリリースでは死にました。私は成功から直接の.debをインストールしていたlaunchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351してから実行していますdupeguru_me
rjh

最新バージョンには削除の制限はありません。ただし、音楽をフィンガープリントするようには見えず、ファイル名/ ID3情報を比較するだけです。Picardなどのツールを使用して最初に音楽にタグを付けると、うまくいくはずです:)
rjh

10

このために少し前に作成されたプラグインがあります。私は最近それを使用しましたが、まだ少し残っています。そのための「PPA」がありますが、まだビルドされたパッケージはなく、Bazaarブランチのみです。インストール手順は次のようになります。

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Bazaar'dのソースコードを使用することに興味がある場合は、代わりに以下を実行します。

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

インストールが完了したら、Rhythmboxを再起動すると、プラグインリストにDuplicates Finderが表示されます。

プラグインリスト

アクティブ化した後、追加の構成オプションが利用可能になります。

設定ウィンドウ

プラグインが有効になった後、および重複が見つかった場合、ライブラリリストに追加オプションが追加されます。

リスト

「奇数」として見つけたいくつかの設定-これは、120,000曲以上(1,000を超える複製)のメディアライブラリと、約1,000曲と30の複製を含むライブラリで試してみました。前者では、検索に非常に長い時間がかかり、Rhythmboxが数回クラッシュしました。最終的に、リストを再構築する必要を避けるために、自動的に「ライブラリから削除」を使用しました。小さいライブラリではすべてがうまく機能します。

重複が見つかった場合-デフォルトのオプションが選択されている場合-曲の低品質バージョンがリストに追加されます。そのため、重複リストですべての曲を選択して「削除」(ディスクから削除するか、ライブラリから削除する)しても安全です。


このヒントを提供してくれてありがとう!ただし、一度アクティブ化しても何も起こらないようです。新しいタブ、または重複が示される場所を見つけることができません。
インゴ

重複を整理するために、しきい値を0.5に移動する必要がある場合があります。ライブラリリストに追加アイテムとして表示されます。これを示すために回答を更新しました。
マルコセッピ

それも試してみました。失敗。
インゴ

5

そのためにfdupesを使用できます。

$ fdupes -r ~/Music

すべての重複ファイルのリストが表示されます。

簡単にインストールできます

sudo apt-get install fdupes

4
これは他のオプションよりもうまく機能しました。ただし、実際にはオーディオファイルには適していません。ソフトウェアはタグなどを比較しないため、ファイルのリストが非常に短くなりますが、実際には多くの重複がありますが、ファイルサイズがまったく同じではない可能性があります(異なるソースからのものである可能性があります)。
インゴ

3

重複する画像ファイルがたくさんあるときに、同様の問題に遭遇しました。私の場合、md5sumファイルで使用し、結果をソートしました。

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

同じ内容のファイルは同じハッシュを生成したため、重複を簡単に見つけることができました。私はそこから重複を手動で削除しましたが、スクリプトを拡張して最初の発生以外をすべて削除することもできましたが、アドホックスクリプトでそれを行うことは常に妄想です。

これは、同じ内容の重複ファイルに対してのみ機能することに注意してください。


高速:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
ロバートビラ

1

FSlintまたはdupe gredtterをお試しください

ターミナルにFSlintタイプをインストールするには(Ctrl-Alt-T)

sudo apt-get install fslint

これが役立つことを願っています。


-2

FSlintを使用して、一般的に重複ファイルを見つけました。FSlintは「ファイルシステム上のさまざまな形式のlintを見つけてきれいにするユーティリティ」です。


それ、変だよ。FSlintで重複した曲が見つかりません!
インゴ

FSlintのデフォルト設定では、ファイル名とファイルサイズで測定された重複ファイルが検出される可能性がありますが、サイズとファイル名が異なる異なる録音の場合は曲が重複しません。
Aputsiak

異なる録音(リミックス?)は削除しても安全ではありません。それらには独自の価値があるかもしれません。
エクステンダー

私はオーディオにもfslintを使用しました(合理的な成功を収めました)-このスレッドの代替案のいくつかを考えると、おそらく次回にそれらの1つを試すでしょう。
ベラク
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.