Maildirから重複メッセージを削除する


10

IMAPサーバーのMaildirに重複したメッセージがたくさんあります。それらを削除する最良の方法は何ですか?

関連するポイント:

  • 共有メッセージIDは通常、複製の十分な定義です。重複するメッセージの1つを除くすべてを削除する小さなスクリプトが機能します。
  • 共有メッセージ本文に基づいて重複を見つける必要がある場合があります。ここで共有の合理的な定義は何ですか?ビット単位で同等ですか?行の折り返し、エスケープ、文字エンコーディングの奇妙な違いはどうですか?
  • 「重複」メッセージには、意味のある違いがある場合があります。「重複」メッセージのセットの違いを確認する最良の方法は何ですか?差分?

回答:


6

上記のケビンのスクリプトにいくつかの大幅な改善を加えましたが、彼は私のプルリクエストを受け入れるのに十分親切でした。最終的には、これを専用のプロジェクトに分割し、ここで見つけることができます。

https://github.com/kdeldycke/maildir-deduplicate


このスクリプトは新しい場所に移動したので、リンクを更新しました。
Adam Spiers 14

3

Linuxの一般的なファイルの場合、私はfdupes utilsを使用して重複ファイルを削除します。Maildirメッセージでも機能することがわかりました。


1
fdupesは正確な重複に対してのみ機能するようですが、OPは(暗黙的に)より複雑な重複パターンについて尋ねています。メッセージが2回配信さ.forwardれるのは、ヘッダーが多少異なるためです。メッセージ自体は重複していますが、2つのコピーを含む2つのファイルは重複していない場合があります。
tripleee 2017

0

Gnome's Evolution [グラフィカルメールユーザーエージェント]には、重複メールを削除するための組み込み機能があります。このヘルプページで説明したようにで、要約すると:

  1. 疑わしいメッセージ(またはすべてのメッセージ)を選択します
  2. [メッセージ ]メニューに移動し、[重複メッセージの削除 ]を選択します。

ボイラ。

PS Evolutionはメッセージをローカル(MailDir、MH、Mbox)またはIMAP経由でアクセスできます。


0

今日私が見つけた最高のものは、Kevin Deldyckeのmaildir- deduplicate です。

  • X-MIMETrackデフォルトではヘッダーを無視し、SHA224ダイジェストを使用してヘッダーを比較します。
  • 確認を求めずに重複を自動的に削除します。ただし、どの複製が削除されるかをプレビューできる模擬モードがあります。

誰かがRick Sandersの彼のIMAPツールの一部であるdelIMAPdups.plから何か面白いものを作ることができるに違いない


maildir-deduplicate 新しい場所に移動したので、リンクを更新しました。ただし、情報が古くなっています。
Adam Spiers 14

誤解を招く古い情報がなくなるように、これを更新しました。
Adam Spiers
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.