回答:
dupeGuru Music Editionはあなたが望むものです。環境設定でスキャンタイプを「オーディオコンテンツ」に設定します。このプログラムはフェアウェアですので、できれば貢献してください。
これをMusicBrainz Picardと組み合わせて、音楽ファイルに自動的にタグを付けることをお勧めします。
dupeguru_me
。
このために少し前に作成されたプラグインがあります。私は最近それを使用しましたが、まだ少し残っています。そのための「PPA」がありますが、まだビルドされたパッケージはなく、Bazaarブランチのみです。インストール手順は次のようになります。
wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz
Bazaar'dのソースコードを使用することに興味がある場合は、代わりに以下を実行します。
mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source
インストールが完了したら、Rhythmboxを再起動すると、プラグインリストにDuplicates Finderが表示されます。
アクティブ化した後、追加の構成オプションが利用可能になります。
プラグインが有効になった後、および重複が見つかった場合、ライブラリリストに追加オプションが追加されます。
「奇数」として見つけたいくつかの設定-これは、120,000曲以上(1,000を超える複製)のメディアライブラリと、約1,000曲と30の複製を含むライブラリで試してみました。前者では、検索に非常に長い時間がかかり、Rhythmboxが数回クラッシュしました。最終的に、リストを再構築する必要を避けるために、自動的に「ライブラリから削除」を使用しました。小さいライブラリではすべてがうまく機能します。
重複が見つかった場合-デフォルトのオプションが選択されている場合-曲の低品質バージョンがリストに追加されます。そのため、重複リストですべての曲を選択して「削除」(ディスクから削除するか、ライブラリから削除する)しても安全です。
重複する画像ファイルがたくさんあるときに、同様の問題に遭遇しました。私の場合、md5sum
ファイルで使用し、結果をソートしました。
for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort
同じ内容のファイルは同じハッシュを生成したため、重複を簡単に見つけることができました。私はそこから重複を手動で削除しましたが、スクリプトを拡張して最初の発生以外をすべて削除することもできましたが、アドホックスクリプトでそれを行うことは常に妄想です。
これは、同じ内容の重複ファイルに対してのみ機能することに注意してください。
find $rootdir -name '*.jpg' -exec md5sum {} + | sort
FSlintを使用して、一般的に重複ファイルを見つけました。FSlintは「ファイルシステム上のさまざまな形式のlintを見つけてきれいにするユーティリティ」です。