編集、注釈、またはプレビューでPDFファイルを開いて保存するだけでも、ファイルサイズが大幅に増加するようです。スキャンした本の中には、これがページのレンダリング時間を改善するために起こることにも気づきました。
誰がこれらの変化を引き起こすために何が起こっているかについていくつかの光を当てることができますか?PreviewとiPad(GoodReaderかもしれません)の間でPDF電子ブックの注釈を同期することに興味がありますが、これは大きなPDFファイルでは実用的ではないかもしれません。
編集、注釈、またはプレビューでPDFファイルを開いて保存するだけでも、ファイルサイズが大幅に増加するようです。スキャンした本の中には、これがページのレンダリング時間を改善するために起こることにも気づきました。
誰がこれらの変化を引き起こすために何が起こっているかについていくつかの光を当てることができますか?PreviewとiPad(GoodReaderかもしれません)の間でPDF電子ブックの注釈を同期することに興味がありますが、これは大きなPDFファイルでは実用的ではないかもしれません。
回答:
あまり知られていない小説PDF Kareninaで、Leo Tolstoyは次のように書いています。
最適にエンコードされたPDFファイルはすべて同じです。準最適にエンコードされたPDFファイルはすべて、独自の方法で準最適にエンコードされます。
プレビューがそれらを修正した後にあなたの PDFファイルがより大きくなる理由に答えるのは誰にとっても難しいです。PDFファイルは、画像、コンテンツストリーム、フォント、ドキュメントのオーバーヘッド、色空間、拡張グラフィックス状態、相互参照テーブルなど、さまざまな種類のデータで構成されています。1つの文が簡潔でもう1つが冗長であるように、両方とも有効な英語で同じことを言うので、1つのPDFファイルでも同じコンテンツをより簡潔なPDFファイルとして表現するより冗長な方法があるかもしれません。正確なPDFファイルを確認する必要があります。それらは、さまざまな異なるソフトウェアによって作成された可能性が高く、一部は簡潔で、一部はそうではありません。
プレビューで名前を付けて保存するときに新しいPDFファイルを書き込むソフトウェアを決定するため、使用しているMac OS Xとプレビューのバージョンも重要です。
私は、しかし、いくつかの程度大きくなる何かを伝えることができ、私の PDFファイル。この話は、Mac OS X 10.5.8およびApple Preview 4.2(469.5)を実行している私のコンピューターに当てはまります。
1つのファイルはGiulio.pdf
、スキャンされた画像ではなく、テキストがテキストとして含まれる22ページのドキュメントです。461,092バイトの大きさです。プレビューで開き、ファイル...名前を付けて保存...を実行し、新しいファイル名で保存しました。新しいファイルは724,421バイト、つまり57%大きくなります。
Mac OS用のAdobe Acrobat Professionalバージョン8.3.1で各ファイルを開きました。私は高度な... PDFオプティマイザ...監査領域使用量を...。小さなダイアログボックスは、各使用カテゴリに起因するバイト数の内訳と、カテゴリの合計ファイルサイズの割合を示しました。
オリジナルにGiulio.pdf
は、コンテンツストリーム専用の390,754バイト(84.75%)と、画像専用のゼロバイトがあります。PDF 1.4形式です。Previewで保存されたファイルは、コンテンツストリーム専用の675,846バイト(93.29%)で、画像のゼロバイトもあり、PDF 1.3形式です。プレビューにより、コンテンツストリームは285,092バイト大きくなり、2つのファイルサイズの差の73%を表します。
PDF 1.3ファイル形式は、この種のファイルを保存するのに本質的に効率が悪いのではないかと思いました。オリジナルGiulio.pdf
をAdobe Acrobat Professional 8で開き、詳細設定... PDFオプティマイザー...と互換性を持たせました。Acrobat3.0以降と[ OK]を押しました。結果のファイルを新しい名前で保存しました。結果のファイルはPDF 1.3形式で、452,356バイト、つまり元のサイズよりも小さくなりました。そのコンテンツストリームは375,171バイト(82.94%)で、同様の割合ですが、元のファイルのコンテンツストリームよりも小さくなっています。
したがって、Mac OS X 10.5.8のプレビューアプリは、PDFファイルで簡潔なコンテンツストリームを作成する他のPDFクリエーターほど効率的ではなく、サイズの違いの4分の3を占めるのに十分であると結論付けることができるようです。画像のないPDFファイル。
form k.pdf
紙からスキャンした1ページのドキュメントで、同様の実験を行いました。元のファイルは303,730バイトで、そのうち298,197バイト(98.18%)は画像です。[名前を付けて保存...]を使用してプレビューで作成されたこのファイルのコピーは300,601バイト、つまり1%小さくなります。このファイルサイズの違いは、プレビューによって作成されるファイル内のバイトの小さな「ドキュメントオーバーヘッド」カテゴリによって説明される以上のものです。
したがって、プレビューによってPDFファイルのサイズが常に大きくなるとは限らないと結論付けることもできます。それは元のPDFファイルの性質と、それがどの程度簡潔であるかによって異なります。
私はこれがかなり遅いことを知っていますが、少なくとも最初に使用した場合は動作するように見えるものを見つけました。動作しているようですが、デフォルトではオンになっていません。[名前を付けて保存]メニュー(オプションを押したまま)を使用して具体的に選択できますが、自動保存の通常の方法がデフォルトになることが心配です。
これが私にとって何が起こっているのか、そもそもどうやってこのページにたどり着いたのかです:PDFは91MB 900ページのブックから始まります。単一の注釈を追加して保存すると、ファイルは2.29GBまでジャンプします。さらに、特に外部ドライブに保存しているため、保存には永遠に時間がかかります。ドライブがUSB 3であることに感謝します!
とにかくこれらの注釈を抽出する方法はありますか?iPadでGoodreaderとPDF Expertに注釈を付けて強調表示できます。プレビューでコンピューターでこれを実行できない場合、他にアプリはありますか?注釈/ハイライトを保存するだけで、毎回JPEGを保存しているように、すべての写真を再圧縮しようとしないのはなぜですか。助けてくれてありがとう!
ソリューションに手がかりを追加できません。同様のシナリオ(OS X 10.11.3)を追加できます:〜800kbでスキャンされたPDFがプレビューで開かれ、空のスキャンされたページがいくつか削除され、結果の2ページの短いPDFは〜2,2Mbです。「オプション-名前を付けて保存」および「ファイルサイズを小さくする」クォーツフィルターを選択すると、ファイルが... 1,9Mbに圧縮されます。
元のファイルはXerox WC 7830コピー機によって生成されたもので、私の経験では(以前の多機能プリンター/コピー機と比較して)非常に最適化されたスキャンpdfを生成します。
ファイルの違いを視覚的に確認できません。私はしたいと思い、元のファイルは、はるかに少ないカラー深度を使用したクリアリーであるのに対し、ページ画像は24bppのに再圧縮されている可能性が高い6ビット(それは印刷して署名された文書ですが、テキストのみ、スキャナは維持の良い仕事を作ります白い背景の純粋な白)。悲しいことに、プレビューはこれを検出して維持するのに十分ではなく、残りのページに変更は加えられませんが、ファイル全体を再圧縮する必要があるようです(ここでも、いくつかのページのみが削除されています。