エクスポート:改行なしでPDFからテキストをコピーします


12

すべてのテキスト行がハードコーディングされているように見えるPDFがいくつかあります。テキストブロックをコピーすると、すべてが付属します。改行と「-」セパレータもあります。

私の質問は次のとおりです。この動作が発生しないInDesignでPDFを作成するにはどうすればよいですか。

誰かがこれについてもっと知っていますか?


2
これは多くの学術記事で大きな問題であり、この問題の理由/解決策が見つからないことをコメントしたいと思います。良い答えを期待しています!
ベンテ

...そのため、先カンブリアム時代からのばかげた慣行における古代のエクスポート機能のせいかもしれません。
ベンテ

回答:


3

これは、多くのソフトウェアやオンラインアプリからさまざまな方法でPDFを生成できるためです。これらはそれぞれ、テキストの行を異なる方法で処理しているため、PDFからInDesignにテキストをコピーして貼り付けようとするまで、テキストが実際にどのように囲まれているかを知ることはできません。

ただし、InDesignでエクスポートされたPDFでは、通常、各行の最後にスペースが保持されるため、各行の後に段落が挿入されることを心配する必要はありません。100%確認するには、Create Tagged PDFInDesignからPDFをエクスポートするときにチェックボックスをオンにします。個人的に私は常にこのボックスをチェックし、使用しているプリセットに含めます。このオプションの詳細については、こちらをご覧ください

正しくエクスポートされていないPDFに遭遇し、テキストの各行の後に続く段落の戻り値をクリーンアップする必要がある場合、最も速いオプションは検索/置換です。フィールドに入力^pし、Find whatフィールドに空白スペースを入れChange toます。いずれかを選択しStoryたりSelection、状況に応じて、下に、これはあなたのテキストをクリーンアップする必要があります。

変更の検索ダイアログボックス


2

動作する1つの方法は、Acrobat ProからPDFをHTMLとしてエクスポートし、Webブラウザーでそのファイルを開き、そこからテキストをコピーすることです。

テキスト形式としてエクスポートするのとは異なり、htmlは通常行を分割しません。

私の知る限り、これをInDesignから防ぐことはできません。これはPDFまたはPDFソフトウェアに由来する動作のようです。「テキストフレーム/ボックス」を使用するパブリッシングソフトウェアが、そのようなテキストをPDFで作成する可能性があります。


-2

これは、pdfがテキストを認識する方法だからです。実際、すべての行が段落になります(したがって、最後に戻ります)。方法はありません。コピー後、検索/置換オプションと非表示文字を使用して、ドキュメント内でグローバルに変更する必要があります。


1
しかし、この振る舞いを持たないpdfがあります。PDFを使用すると、面倒なしにすべてをコピーできます。どうやってこれを輸出中に達成できるのだろうか。
KSPR
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.