PDFに関するメタデータの発見


32

PDFがあり、そのPDFで利用可能なメタデータを取得したいとします。どのユーティリティを使用する必要がありますか?

私が普段最も知りたい情報は、PDFビューアーが報告しない用紙サイズです。たとえば、PDFサイズの文字は合法ですか、A4ですか?しかし、利用可能な他の情報も興味深いかもしれません。

編集:@terdonのおかげで、ここに用紙サイズの便利なガイドがあります。


奇妙な。なぜ誰かがこの質問に反対票を投じるのでしょうか?説明する気?
ファヒームミサ14

回答:


39

このための標準的なツールの1つは、pdfinfo思い出すとxpdfに付属しています。出力例:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

1
Debianでは、少なくともこれはpoppler-utilsの一部です。ここには、pdfinfoが595.2 x 841.44 ptsとして報告するファイルがあります。しかし、これはA4として報告されていません。A4としてマークすることにしたものは何ですか?
ファヒームミタ14

2
名前はハードコードされています:文字は612±0.1 x 792±0.1、DIN / ISO Aのマジックサイズは(すべて±1 pt)です:3370.98、2383.64、1685.49、1191.82、842.74、595.91、...あなたのページはpdfinfoそれを拾うには狭すぎます。
ウルリッヒ・シュワルツ14年

なるほど、ちょっとしたコードif ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))
ファヒームミサ14

それは文字です、A形式はsqrt(2)s と共にループ内にあります。
ウルリッヒ・シュワルツ14年

13

調べる価値のあるもう1つのユーティリティはexiftoolです。ドキュメントのジオメトリに関する情報を報告しないため、特定のケースでは適切なツールではないかもしれませんが、一般的にはおそらくPDFメタデータを検査するための最も機能が充実したツールです。

以下は、利用可能なすべてのメタ情報(-a)をグループ(-G1)でソートして出力するコマンドの例です。

exiftool -a -G1 "$File"

公式ドキュメントには、サポートされているPDF関連のタグの概要が記載されています。

Debian / Ubuntuにexiftoolをインストールするには、次を使用します。

sudo apt-get install libimage-exiftool-perl

物事のGUI側にもっと興味があれば、私のプロジェクトPDFMtEdを試してみてください。これはexiftoolのグラフィカルなフロントエンドとして機能し、PDFメタデータの表示と編集を可能にするツールのセットです。

以下にスクリーンショットをいくつか示します。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.