Adobe 9.0で内部PDF構造を参照する方法は?
このオプションを備えた詳細メニューは見つかりませんでした。
どんな体も助けてくれますか?
Adobe 9.0で内部PDF構造を参照する方法は?
このオプションを備えた詳細メニューは見つかりませんでした。
どんな体も助けてくれますか?
回答:
PDFの内部構造を参照するには、いくつかの方法があります。
セキュリティパスワードがなければ、その多くは人間が読める形式です。PDFにパスワードがある場合、すべての文字列とストリーム(既に圧縮されているため、損失はありません)は、疑似ランダムガベージになります。圧縮されたデータストリームはたくさんありますが、お気に入りのテキストエディタでは、その多くは次のようになります。
2 0 obj
<< /Type /Page
/MediaBox [0 0 612 792]
/Contents 4 0 R
/Resources << /Fonts
<< /F1 5 0 R>>
>>
>>
endobj
警告:空白はほとんど無関係であり、通常は可能であれば削除されます。少しわかりやすくするために、これをきれいにしただけです。
<<および>>「辞書」の開始と終了。辞書はキー/値のペアで構成されています。キーは常に「名前」です。すべての名前は「/」で始まります。値は、別の名前を含む、何でもかまいません。
[および]「配列」の開始と終了。配列は、ほぼすべてのもので構成できます。
数字は「数字」です。浮動小数点など。
()および<>「文字列」の開始と終了。<>文字列は16進値としてリストされ、()はANSI文字列です。
Pet Peeve:/ Namesと(Strings)はまったく異なるエスケープシステムを使用します。Grr。
間接参照は、PDF内の他のオブジェクトを指します:
<objNum> <generationNum-AlwaysZero> R
上記のサンプルオブジェクトでは、コンテンツストリームはPDF内のオブジェクト4にあります。それを見つけるには、エディターのテキスト検索で「N 0 obj」を使用します。ここで、Nは目的のオブジェクト番号です。
警告:PDFには数百、場合によっては数千のオブジェクトがあります。「1 0 obj」を検索すると、ヒット数が多くなります。
あなたが内部構造を見たいと思っているなら、おそらくあなたはすでにこれらすべてを知っているでしょう。同じことを知りたい人はそうではないかもしれません。
警告:テキストエディターでPDFを編集しないでください。バイナリのものはすべて壊れてしまいますが、バイトオフセットはPDFでは非常に重要です。
Windjack SolutionsによるPDF CanOpenerと呼ばれるacrobatプラグインがあります(提携なし)。スリックです。PDF構造をツリーとして参照したり、コンテンツストリームを確認(および変更)したりすることができます。
たくさん。多くの人々は、PDFを解析する学習の一部として、またはデバッグツールとして1つを構築します。彼らは非常に便利です。
O2Solutionsは、PDFドキュメントの内部構造を表示するためのMS Windows互換ユーティリティを提供します。個人および商用での使用は無料です。
Browse Internal PDF Structure
Preflightプラグインからのコマンドを使用して、Adobe Acrobatの内部PDF構造を参照できます。
http://www.jpedal.org/PDFblog/2009/04/viewing-pdf-objects/
Acrobat 用の商用PDF CanOpenerプラグインを使用してオブジェクト構造を表示したり、無料のPDFeditを使用してPDFの圧縮データストリームをデコードすることもできます。
PoDoFoBrowserは、内部PDF構造の閲覧だけでなく、オブジェクトデータのエクスポート、インポート、編集を可能にする小さな無料のポータブルユーティリティです。ここからダウンロードできます:
http://sourceforge.net/projects/podofo/files/podofobrowser/0.5/
Windowsでの表示は次のとおりです。
PDF Voleが壊れているようです。誰かがまだツールを探しているなら、私は無料のPDF Analyzerを使用しています。
PDF Vole
リンクが...今壊れているようだ