紙のバージョンから明らかにスキャンされた電子書籍/紙を見たことがありますが、電子書籍/紙のテキストは驚くほどコピーできます。直接スキャンされたバージョンは、いくつかの光学式文字認識ソフトウェアによって処理されたに違いないと思います。
推奨される光学式文字認識ソフトウェアは何ですか?特に、Ubuntu向けまたは無料のどちらですか?Windowsの方がはるかに優れている場合は、私にも知らせてください。
スキャンされたpdfファイルを入力として受け入れ、入力と同じように見えますがテキストがコピー可能な別のpdfファイルを生成できるOCRに特に興味があります。
よろしくお願いします!
回答ごとに1つのソフトウェアを制限してください