サイズ変更された写真など、重複した写真を見つけるために何を使用できますか?
サイズ変更された写真など、重複した写真を見つけるために何を使用できますか?
回答:
すべての写真をコレクションに追加します。メニューで、「ツール/重複の検索」を選択します。これにより、コレクション全体で重複が検索されます。
コマンドラインツール。比較するすべての画像をコマンドラインで渡します。
メニューで、「ファイル/重複の検索」を選択します。画像ファイルをドラッグアンドドロップして複製ウィンドウを作成します。ディレクトリを削除して、その内容を再帰的に追加できます。画像を視覚的に比較するために、ドロップダウンメニューに特定のデフォルト以外のオプションがあります。「カスタム」レベルの類似性では、ペアリングを最高の類似度のみに制限できますが、「Preferences」で99に設定する必要があります。それでも、少なくとも一部の種類の画像、たとえばアート。残念ながら、解像度、日付などの合理的な基準を備えた自動選択メカニズムは提供されません。自動選択は、保存する参照として見つかった最初の画像をランダムに選択するだけです。多くの画像を削除すると、削除のたびに結果カウントを更新しようとするため、非常に時間がかかる場合があります。
これらの3つのツールはすべて、バイトごとに同一のファイルだけでなく、視覚的な重複を検出します。
fslint
は、md5sumによって任意のタイプの重複ファイルを見つけることができるグラフィカルプログラムです。画像が同一でない場合、重複としてフラグは付けられません。以下の画像は、ダウンロードディレクトリにある多数の重複したpdfファイルを示しています。
高度な検索パラメーターを変更して、ファイルタイプで検索し、画像のみに制限することができます。これは、find
コマンドオプションとして「追加の検索パラメーター」を変更することで実行されます。たとえば、ここでは*.jpg
ファイルを探しているだけです(同じパスで、「ダウンロード」フォルダのみを探しています:
fdupes
同等のコマンドラインベースのツールです。どちらもリポジトリで入手できます。
fdupes
重複するファイルを見つけるために呼び出されるコマンドラインツールを使用できます(詳細についてはman fdupes
、を参照してください)。サイズが変更された「重複」を見つける方法がわかりません。これを行うプログラムには、画像のサイズを変更するとデータが変更されるため、従来の重複検索方法が機能しないため、画像コンテンツを分析する何らかのインテリジェントなアルゴリズムが必要です。
imgSeekは、同様の写真だけでなく複製も見つけることができるため(サイズ変更された写真や、異なるファイル名とメタデータを持つ写真を見つけることができるはずです)、スケッチに基づいて写真を検索することもできます。デスクトップおよびサーバーバージョンで利用できます。
しかし、実際に自分で試したことはありません。
dupeGuru Picture Editionは非常に優れた機能を発揮し、試してみる価値があります。
これらにはLaunchpad PPAがあり、dupeguru
(新しいオールインワンパッケージ)またはdupeguru-pe
(古いピクチャーエディションパッケージ)これらのコマンドを使用してインストールできます:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
Visipicsはその機能に対応した無料のWindowsアプリケーションですが、Linuxではもちろんワインでも問題なく動作します(複製のソートに関してはgeeqie / gqviewよりも優れています(geeqieの結果は絶対に「ソート不可」です)。
ファイルサイズの縮小、非圧縮タイプ、低解像度などの基準に基づいて画像を自動選択するように指示することができます(ただし、逆は行われません。手動で行う必要があります。 geeqieで行うよりもはるかに優れていますが、選択にShift/を保持する必要がない点が異なりCtrlます。また、フォルダーに優先順位を付けます(ただし、最後の優先順位はフォルダーの優先順位です)。
ただし、シンボリックリンクに注意する必要があります。実際のファイルを「コピー」として削除しながら、シンボリックリンクをファイルに「ランダムに」選択して保存できます。残念です。