Acrobat 11で複数のCPUコアを使用してOCRを実行できますか?


8

OCR処理には時間がかかります。複数のCPUコアを使用すると、処理速度が向上します。Acrobat 10はマルチスレッドアプリケーションではありませんでした。Acrobat 11はどうですか?デフォルトで11は複数のCPUコアを使用してOCRを実行しますか(可能な場合)?そうでない場合、Acrobat 11が複数のCPUコアを使用してOCRを実行できるようにするために、スクリプトなどの回避策はありますか?Acrobatの組み込みスクリプト言語を使用するか、Acrobatの複数のシングルスレッドインスタンスを起動して処理ジョブの一部と並行して処理する外部スクリプトを使用します。

注:この質問はローカライズされていません(特定の時点に限定されません)。これは、(1)AdobeがAcrobatの新しいメジャーバージョンを頻繁にリリースしないため(Acrobat 10は2年前にリリースされました)、(2)Adobe Acrobatは広く使用されているためです。中古アプリケーション。

回答:


6

VirtualBoxにAcrobat 11(XI)トライアルをインストールしました。Acrobat 11はシングルスレッドです。

複数のAcrobatインスタンス(CPUコアごとに1つ)を起動し、OCRジョブを並列処理して結果をマージする外部スクリプトも作成しました。重要なステップは、Acrobatの環境設定でエラーロギングをオンにし、すべての.logを解析して、エラーファイルを再処理することです。スクリプト(4コアを使用する場合)は、Acrobat 11のデフォルトよりも2倍以上高速にOCRを実行します。


4
必要に応じて、ソースを指定できます。彼らがそれを削除しようとするなら、それは簡単に復元できます。
Joey

また、質問を投稿したのと同じ人物である場合は、現在の未登録アカウントの両方を新しい登録済みアカウントにマージすることを検討してください。あなたは、開始することができ、ここで、とも読み、これを詳細については。その後、必要に応じて質問を修正できます。
Indrek 2012年

私は何も邪魔しようとはしていません。ユーザー名を切り替え続けるため、編集は元の質問を理解していないように思われる第三者によるものであるように見えました。また、自分の質問に答えたい場合は、質問を書いて一度に答えてください。
Isaac Rabinovitch 2012年

今のところ、(未登録の)アカウントを統合しました。ただし、使い捨ての電子メールアドレスは使用しないでください。ログインしたままにしたり、質問にコメントしたりできるように、サイトに登録してください。また、何も削除されず、心配する必要もありません。匿名の編集は常により厳密にレビューされることに注意してください。
slhck 2012年

1
@tarcmanスクリプトを投稿する可能性はありますか?私はそれを使用することに興味がある多くの人々があると確信しています
Jason

1

マルチスレッドはアプリケーションに組み込む必要があります。開発者は、スレッドを作成し、タスクを各スレッドに割り当てることができるサブタスクに分解するコードを記述する必要があります。Acrobatの開発者がOCR認識コードに対してこれを行わない場合、ユーザーが必要な追加のロジックを作成する方法はありません。


2
それをページの範囲に適用できる場合は、作業を複数のプロセスに分割して、それぞれが数ページだけをOCRし、その後結果をマージすることができます。
Joey

0

OCRのすべてのコアを使用するには、PDF-Exchange Editorをご覧ください。OCRエンジンは私のシステムのすべてのコアを使用しているようです。ただし、このレベルのパフォーマンスに到達したら、SSDを使用することは理にかなっています。

I / Oにバインドされていないシングルスレッドアプリケーションにより多くのCPU時間を費やす原因となるWindowsの微調整が必​​要です。私のシステムでは、Acrobatはディスクのパフォーマンスによって遅くなりませんが、インデックスを構築するために取得するCPU時間の最大は約30%です。

正直なところ、Acrobatは広く使用されていますが、不十分に記述されたアプリケーションです。Acrobat Proには、(まだ)他では手に入れられない機能がいくつかあります。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.