タグ付けされた質問 「ocr」

5
LinuxでコマンドラインからOCRを使用する方法
スキャンされた本のページが数千ページあります。各ページは個別にJPGとして保存されます。文章は明確ですが、フォントはさまざまで、ページには写真やイラストが含まれています。 各JPGファイルに表示されるすべての単語のリストを作成する必要があります。表示される単語をリストした画像をスキャンするためのコマンドラインツールはありますか?完全なスキャンが必要なわけではなく、単なる見積もりです。
30 command-line  ocr 

4
PDFファイルをOCRし、PDF内に保存されたテキストを取得する方法は?
最初に、これが以前に尋ねられた場合は謝罪します-私は既存の投稿をしばらく検索しましたが、サポートが見つかりませんでした。 Fedoraが複数ページの検索不可能なPDFをOCRし、このPDFを画像の上にテキストレイヤーを含む新しいPDFファイルに変換するソリューションに興味があります。Mac OSXまたはWindowsではAdobe Acrobatを使用できますが、Linuxでは特にFedoraで使用できますか? https://snippets.webaware.com.au/howto/pdf-ocr-linux/は解決策を説明しているように見えますが、残念ながらexact-imageを取得するときにすでに失われています。
23 command-line  pdf  ocr 


5
LinuxシステムのOCR [終了]
閉じた。この質問はより集中する必要があります。現在、回答を受け付けていません。 この質問を改善したいですか?この投稿を編集するだけで1つの問題に焦点を当てるように質問を更新します。 2年前に閉店。 私は常に、OCRテクノロジーがオープンソースシステムの背後にあることを発見しました。Ocropusプロジェクトはまだ始まったばかりから見ています。Linuxで利用できる最高のOCRエンジンであるTesseractを聞いたところ、試してみましたが、ビジネスドキュメントには非常に欠けていることがわかりました。他のより有望なOCR実装はありますか?手書き文字を解釈するためのさらに希望に満ちた目標はどうですか?この分野の* nixシステムでは何が可能ですか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.