PDFスマートファイル差分


9

組み込み機能を使用して、ある時点でPDFに変換したLibreOfficeドキュメントがあります。PDFのタイムスタンプはワープロドキュメントよりも遅いため、それは理にかなっていますが、ワープロドキュメントがそのPDFを正確に生成するかどうかは確実ではありません。文書は20ページの長さなので、手動で確認することはお勧めできません。

1つの可能性は、PDFを別のフォルダーでやり直してから、2つのPDFのバイナリdiffを実行することです。残念ながら、コマンドラインdiffは「バイナリファイルが異なる」ことを示しています。

違いが単にメタデータにあるのか、そうでない重要でない違いなのかを判断するのに役立つ「スマートバイナリ差分」はありますか?

回答:


13

一般に、コマンド+ファイル拡張子が目的のものかどうかを確認することをお勧めします。diff + pdfはdiffpdfになります。

sudo apt-get install diffpdf

DiffPDFは、2つのPDFファイルを比較するために使用されます。デフォルトでは、比較はページの各ペアのテキストの比較ですが、ページの外観の比較もサポートされています(たとえば、図が変更された場合や段落が再フォーマットされた場合)。特定のページまたはページ範囲を比較することも可能です。たとえば、PDFファイルの2つのバージョンがあり、1ページが1〜12ページで、もう1ページが1〜13ページである場合、ページ4として追加された余分なページがあるため、2つのページ範囲1を指定して比較できます。最初は-12、1番目は1-3、2番目は5-13です。これにより、DiffPDFは(1、1)、(2、2)、(3、3)、(4、5)、(5、6)などのペアのページを(12、13)と比較します。

ここに画像の説明を入力してください

出典:Ubuntugeek.com

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.